{"id":15569,"date":"2026-05-28T10:39:16","date_gmt":"2026-05-28T10:39:16","guid":{"rendered":"https:\/\/www.proefschriftmaken.nl\/portfolio\/kaiwen-wang\/"},"modified":"2026-05-28T10:39:23","modified_gmt":"2026-05-28T10:39:23","slug":"kaiwen-wang","status":"publish","type":"us_portfolio","link":"https:\/\/www.proefschriftmaken.nl\/en\/portfolio\/kaiwen-wang\/","title":{"rendered":"Kaiwen Wang"},"content":{"rendered":"","protected":true},"excerpt":{"rendered":"","protected":true},"author":7,"featured_media":15570,"comment_status":"closed","ping_status":"closed","template":"","meta":{"_acf_changed":false,"footnotes":""},"us_portfolio_category":[45],"class_list":["post-15569","us_portfolio","type-us_portfolio","status-publish","post-password-required","hentry","us_portfolio_category-new-template"],"acf":{"naam_van_het_proefschift":"From Perception to Phenotyping","samenvatting":"De wereldwijde landbouw staat onder toenemende druk om meer voedsel te produceren met minder middelen, onder omstandigheden van schaarste aan arbeidskrachten, klimaatvariabiliteit en stijgende eisen op het gebied van duurzaamheid. In overjarige houtige teeltsystemen zoals boomgaarden en wijngaarden vereist precisiebeheer gedetailleerde, ruimtelijk consistente informatie op het niveau van individuele planten en vruchten. Onbemande luchtvaartuigen (UAV's) uitgerust met visuele sensoren zijn naar voren gekomen als een flexibel platform voor data-acquisitie met een hoge resolutie, maar hun effectieve inzet hangt af van robuuste lokalisatie, kartering en semantisch begrip van complexe buitenomgevingen. In deze context vormt Simultaneous Localization and Mapping (SLAM) een cruciaal fundament voor het transformeren van ruwe luchtbeelden naar ruimtelijk coherente en bruikbare representaties.\n\nHet hoofddoel van dit proefschrift is het bevorderen van op UAV gebaseerde monoculaire SLAM- en 3D-perceptiemethoden voor precisiebeheer van houtige gewassen. Het onderzoek richt zich op het verbeteren van robuustheid, ruimtelijke consistentie en semantische relevantie van door UAV afgeleide kaarten in structureel complexe boomgaarden en wijngaarden, inclusief uitdagende belichtingscondities zoals die worden aangetroffen in agrivolta\u00efsche systemen. Om dit doel te bereiken, behandelt het proefschrift vier onderzoeksvragen: (1) inzicht krijgen in de stand van de techniek in op UAV gebaseerde SLAM voor buitenomgevingen, (2) het evalueren van de prestaties van monoculaire SLAM onder realistische landbouwomstandigheden, (3) het mogelijk maken van 3D-vruchtperceptie en fenotypering op vruchtniveau op basis van monoculaire data met een beperkt aantal gezichtspunten, en (4) het verbeteren van de robuustheid van visuele SLAM onder aanhoudende schaduwen en belichting met hoog contrast.\n\nNa een inleidend hoofdstuk dat de rol van robotica, luchtplatforms en SLAM in duurzame landbouw vaststelt, presenteert Hoofdstuk 2 een systematische scoping review van op UAV gebaseerde SLAM in buitenomgevingen. Met behulp van een op PRISMA gebaseerde methodologie analyseert het hoofdstuk 97 studies gepubliceerd tussen 2003 en 2022, waarbij sensorconfiguraties, algoritmische paradigma's, toepassingsscenario's en evaluatiestrategie\u00ebn worden behandeld. De review laat zien dat het meeste bestaande onderzoek algoritme-geori\u00ebnteerd is, vaak ge\u00ebvalueerd in stedelijke of gesimuleerde omgevingen, met beperkte aandacht voor landbouwomgevingen en op het veld gebaseerde benchmarking. Het hoofdstuk identificeert belangrijke kennislacunes met betrekking tot domeinspecifieke evaluatie, robuustheid ten aanzien van vegetatiedynamiek en de integratie van SLAM-outputs met landbouwtaken.\n\nHoofdstuk 3 pakt deze lacunes aan door middel van een uitgebreide benchmarkingstudie van monoculaire op UAV gebaseerde lokalisatie en kartering in wijngaarden. ORB-SLAM3, Droid-SLAM en Structure-from-Motion benaderingen worden ge\u00ebvalueerd onder verschillende vluchtpatronen, kijkgeometrie\u00ebn en belichtingscondities die representatief zijn voor echte landbouwactiviteiten, op basis van vijf metrieken: effici\u00ebntie, compleetheid van de puntenwolk, nauwkeurigheid van de UAV-positie, parametergevoeligheid in SLAM en ruimtelijke nauwkeurigheid op plantniveau. De resultaten tonen aan dat op deep learning gebaseerde SLAM de gemiddelde positiefout met 87% verminderde en de resolutie van de puntenwolk met 571% verhoogde ten opzichte van op kenmerken gebaseerde SLAM, terwijl op kenmerken gebaseerde SLAM een superieure effici\u00ebntie vertoonde voor real-time toepassingen. Dit hoofdstuk biedt empirisch inzicht in de sterke en zwakke punten van monoculaire SLAM in gestructureerde overjarige gewassen en benadrukt het belang van domeinbewuste evaluatie bij het selecteren van perceptie-pipelines voor landbouw-UAV's.\n\nHoofdstuk 4 gaat verder dan puur geometrische kartering en stelt een op UAV gebaseerd monoculair panoptisch karteringsraamwerk voor boomgaardomgevingen voor. Door instantie-segmentatie (Grounded-SAM2), data-associatie vanuit meerdere gezichtspunten en reconstructie (SfM) te integreren met impliciete vormvoltooiing (DeepSDF), maakt het raamwerk 3D-reconstructie mogelijk van individuele vruchten ingebed in een gereconstrueerde boomgaardsc\u00e8ne, wat werd ge\u00ebvalueerd in een echte appelboomgaard. De resultaten tonen aan dat de prestaties op het gebied van het volgen en segmenteren van vruchten met Grounded-SAM2 beter waren dan die van TrackRCNN en PointTrack, met 34,84% MOTSA, 14,95% sMOTSA en 71,98% MOTSP. De 3D-appels kunnen worden gereconstrueerd en voltooid bij occlusies van meer dan 10% van de vruchtobjecten. Het hoofdstuk toont aan dat, ondanks gedeeltelijke waarnemingen en occlusies, biologisch betekenisvolle vruchtvormen kunnen worden hersteld en ruimtelijk kunnen worden gerefereerd binnen de op SfM gebaseerde kaart. Kwantitatieve en kwalitatieve evaluaties laten zien dat de voorgestelde aanpak de kloof overbrugt tussen op SfM gebaseerde geometrie en applicatie-gestuurde fenotyperingsvereisten.\n\nHoofdstuk 5 richt zich op op UAV gebaseerde visuele SLAM en fenotypering in agrivolta\u00efsche boomgaarden, waar fotovolta\u00efsche panelen zorgen voor aanhoudende schaduwen, hoog contrast en snel veranderende belichting. Het hoofdstuk vergelijkt de perceptieprestaties tussen conventionele en agrivolta\u00efsche boomgaardsystemen en onderzoekt een op Retinex gebaseerde belichtingsbewuste verwerkingsmethode door belichting te scheiden van reflectie en chromaticiteit te behouden om lokalisatie en kartering te stabiliseren. Door de absolute positiefout (APE) en relatieve positiefout (RPE) voor SLAM-metrieken en boomhoogte voor fenotypische metrieken te evalueren, werd de RMSE van de APE in niet-agrivolta\u00efsche en agrivolta\u00efsche boomgaarden respectievelijk verminderd met 20,91% en 23,37%, en de schatting van de boomhoogte was consistenter en betrouwbaarder na Retinex-verbetering. Met behulp van gereconstrueerde sc\u00e8nes worden fenotypische kenmerken zoals boomhoogte en ruimtelijke verdeling ge\u00ebxtraheerd, wat de haalbaarheid aantoont van op UAV gebaseerde fenotypering, zelfs onder uitdagende lichtomstandigheden.\n\nHoofdstuk 6 synthetiseert de bevindingen van het proefschrift en reflecteert op hun implicaties voor landbouwrobotica en precisiebeheer van boomgaarden. De gecombineerde resultaten laten zien dat robuuste op UAV gebaseerde monoculaire SLAM, gekoppeld aan semantische perceptie en vormvoltooiing, analyse op plant- en vruchtniveau kan ondersteunen in echte landbouwomgevingen. Het proefschrift draagt bij aan een gestructureerd begrip van op UAV gebaseerde SLAM, biedt domeinspecifieke benchmarking-bewijzen en een praktisch raamwerk voor 3D-vruchtfenotypering. Samen helpen deze vorderingen de kloof te overbruggen tussen algemeen onderzoek naar robotperceptie en de operationele behoeften van duurzaam beheer van houtige gewassen, terwijl richtingen worden geschetst voor toekomstig onderzoek naar langdurige, schaalbare landbouwautonomie.","summary":"Global agriculture faces increasing pressure to produce more food with fewer resources, under conditions of labor scarcity, climate variability, and rising sustainability demands. In perennial woody crop systems such as orchards and vineyards, precision management requires detailed, spatially consistent information at the level of individual plants and fruits. Unmanned aerial vehicles (UAVs) equipped with visual sensors have emerged as a flexible platform for high-resolution data acquisition, but their effective deployment depends on robust localization, mapping, and semantic understanding of complex outdoor environments. In this context, Simultaneous Localization and Mapping (SLAM) forms a critical foundation for transforming raw aerial imagery into spatially coherent and actionable representations.\n\nThe main objective of this thesis is to advance UAV-based monocular SLAM and 3D perception methods for precision management of woody crops. The research focuses on improving robustness, spatial consistency, and semantic relevance of UAV-derived maps in structurally complex orchards and vineyards, including challenging illumination conditions such as those found in agrivoltaic systems. To achieve this objective, the thesis addresses four research questions: (1) understanding the state of the art in UAV-based SLAM for outdoor environments, (2) evaluating the performance of monocular SLAM under realistic agricultural conditions, (3) enabling fruit-level 3D perception and phenotyping from sparse-view monocular data, and (4) improving visual SLAM robustness under persistent shadows and high-contrast illumination.\n\nFollowing an introductory chapter that establishes the role of robotics, aerial platforms, and SLAM in sustainable agriculture, Chapter 2 presents a systematic scoping review of UAV-based SLAM in outdoor environments. Using a PRISMA-guided methodology, the chapter analyzes 97 studies published between 2003 and 2022, covering sensor configurations, algorithmic paradigms, application scenarios, and evaluation strategies. The review presents that most existing research is algorithm-oriented, often evaluated in urban or simulated settings, with limited attention to agricultural environments and field-based benchmarking. The chapter identifies key research gaps related to domain-specific evaluation, robustness to vegetation dynamics, and the integration of SLAM outputs with agricultural tasks.\n\nChapter 3 addresses these gaps through a comprehensive benchmarking study of monocular UAV-based localization and mapping in vineyards. ORB-SLAM3, Droid-SLAM and Structure-from-Motion approaches are evaluated under different flight patterns, viewing geometries, and illumination conditions representative of real agricultural operations under five metrics including efficiency performance, point cloud completeness, UAV position accuracy, parameter sensitivity in SLAM and spatial accuracy at the plant level. The results demonstrate that deep learning-based SLAM reduced average position error by 87% and increased point cloud resolution by 571% than feature-based SLAM, while feature-based SLAM showed superior efficiency for real-time applications. This chapter provides empirical insight into the strengths and limitations of monocular SLAM in structured perennial crops and highlights the importance of domain-aware evaluation when selecting perception pipelines for agricultural UAVs.\n\nChapter 4 moves beyond purely geometric mapping and proposes a UAV-based monocular panoptic mapping framework for orchard environments. By integrating instance segmentation (Grounded-SAM2), multi-view data association and reconstruction (SfM), and implicit shape completion (DeepSDF), the framework enables sparse-view 3D reconstruction of individual fruit objects embedded within a reconstructed orchard scene, which was evaluated in a real apple orchard. The results shows that the fruit tracking and segmentation performance with Grounded-SAM2 outperformed than TrackRCNN and PointTrack with 34.84% MOTSA, 14.95% sMOTSA, and 71.98% MOTSP. And the 3D apples can be reconstructed and completed with occlusions more than 10% apple objects. The chapter demonstrates that, despite partial observations and occlusions, biologically meaningful fruit shapes can be recovered and spatially referenced within the SfM-derived map. Quantitative and qualitative evaluations show that the proposed approach bridges the gap between SfM-based geometry and application-driven phenotyping requirements.\n\nChapter 5 focuses on UAV-based visual SLAM and phenotyping in agrivoltaic orchards, where photovoltaic panels introduce persistent shadows, high contrast, and rapidly changing illumination. The chapter compares perception performance between conventional and agrivoltaic orchard systems and investigates a Retinex-based illumination-aware processing method by separating illumination from reflectance and preserving chromaticity to stabilize localization and mapping. By evaluating the absolute pose error (APE) and relative pose error (RPE) for SLAM metrics and tree height for phenotypic metrics, the RMSE of APE in non-agrivoltaic and agrivolatic orchards was reduced by 20.91% and 23.37%, separately, and the tree height estimation was more consistent and reliable after Retinex enhanced. Using reconstructed scenes, phenotypic traits such as tree height and spatial distribution are extracted, demonstrating the feasibility of UAV-based phenotyping even under challenging lighting conditions.\n\nChapter 6 synthesizes the findings of the thesis and reflects on their implications for agricultural robotics and precision orchard management. The combined results show that robust UAV-based monocular SLAM, when coupled with semantic perception and shape completion, can support plant- and fruit-level analysis in real-world agricultural environments. The thesis contributes a structured understanding of UAV-based SLAM, domain-specific benchmarking evidence, and a practical framework for 3D fruit phenotyping. Together, these advances help bridge the gap between general robotic perception research and the operational needs of sustainable woody crop management, while outlining directions for future research toward long-term, scalable agricultural autonomy.","auteur":"Kaiwen Wang","auteur_slug":"kaiwen-wang","publicatiedatum":"8 juli 2026","taal":"EN","url_flipbook":"https:\/\/ebook.proefschriftmaken.nl\/ebook\/kaiwenwang?iframe=true","url_download_pdf":"https:\/\/ebook.proefschriftmaken.nl\/download\/6e8511f1-732c-4028-a506-e5450668053b\/optimized","url_epub":"","ordernummer":"18956","isbn":"","doi_nummer":"","naam_universiteit":"Wageningen University","afbeeldingen":15571,"naam_student:":"","binnenwerk":"","universiteit":"Wageningen University","cover":"","afwerking":"","cover_afwerking":"","design":""},"_links":{"self":[{"href":"https:\/\/www.proefschriftmaken.nl\/en\/wp-json\/wp\/v2\/us_portfolio\/15569","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.proefschriftmaken.nl\/en\/wp-json\/wp\/v2\/us_portfolio"}],"about":[{"href":"https:\/\/www.proefschriftmaken.nl\/en\/wp-json\/wp\/v2\/types\/us_portfolio"}],"author":[{"embeddable":true,"href":"https:\/\/www.proefschriftmaken.nl\/en\/wp-json\/wp\/v2\/users\/7"}],"replies":[{"embeddable":true,"href":"https:\/\/www.proefschriftmaken.nl\/en\/wp-json\/wp\/v2\/comments?post=15569"}],"version-history":[{"count":1,"href":"https:\/\/www.proefschriftmaken.nl\/en\/wp-json\/wp\/v2\/us_portfolio\/15569\/revisions"}],"predecessor-version":[{"id":15572,"href":"https:\/\/www.proefschriftmaken.nl\/en\/wp-json\/wp\/v2\/us_portfolio\/15569\/revisions\/15572"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.proefschriftmaken.nl\/en\/wp-json\/wp\/v2\/media\/15570"}],"wp:attachment":[{"href":"https:\/\/www.proefschriftmaken.nl\/en\/wp-json\/wp\/v2\/media?parent=15569"}],"wp:term":[{"taxonomy":"us_portfolio_category","embeddable":true,"href":"https:\/\/www.proefschriftmaken.nl\/en\/wp-json\/wp\/v2\/us_portfolio_category?post=15569"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}