{"id":15653,"date":"2026-06-01T08:26:07","date_gmt":"2026-06-01T08:26:07","guid":{"rendered":"https:\/\/www.proefschriftmaken.nl\/portfolio\/pedro-mateus\/"},"modified":"2026-06-01T08:26:17","modified_gmt":"2026-06-01T08:26:17","slug":"pedro-mateus","status":"publish","type":"us_portfolio","link":"https:\/\/www.proefschriftmaken.nl\/en\/portfolio\/pedro-mateus\/","title":{"rendered":"Pedro Mateus"},"content":{"rendered":"","protected":true},"excerpt":{"rendered":"","protected":true},"author":7,"featured_media":15654,"comment_status":"closed","ping_status":"closed","template":"","meta":{"_acf_changed":false,"footnotes":""},"us_portfolio_category":[45],"class_list":["post-15653","us_portfolio","type-us_portfolio","status-publish","post-password-required","hentry","us_portfolio_category-new-template"],"acf":{"naam_van_het_proefschift":"AI-based clinical outcome prediction with multicentric data and federated learning","samenvatting":"Artifici\u00eble intelligentie (AI) is een cruciale pijler in het voortdurende streven om zorggegevens te benutten en gepersonaliseerde zorg aan pati\u00ebnten te bieden. Door relevante patronen in gegevens te identificeren, heeft AI het potentieel om de groeiende verzameling complexe zorggegevens te ontsluiten en zo de klinische workflow te ondersteunen. Hoewel veelbelovend, kent de weg naar klinische integratie verschillende uitdagingen. Deze omvatten moeilijkheden bij het verkrijgen van toegang tot representatieve gegevens, het reproduceren van voorgestelde modellen, een gebrek aan generaliseerbaarheid en verklaarbaarheid, het effectief afstemmen van klinische behoeften en het waarborgen van workflowintegratie. Het overwinnen van deze obstakels is cruciaal om het volledige potentieel van AI in de gezondheidszorg te benutten.\n\nIn dit proefschrift onderzoeken we de weg van AI naar klinische integratie aan de hand van praktische voorbeelden. We richten ons met name op federatief leren om het delen van gegevens en het ontwikkelen van generaliseerbare modellen te vergemakkelijken, het gebruik van deep learning om medische beeldvorming te benutten en het bouwen van klinisch relevante voorspellingsmodellen. Bij al deze onderwerpen gaan we in op de uitdagingen die de succesvolle implementatie en acceptatie van AI in de gezondheidszorg in de weg staan.\n\nFederated Learning & Gegevensharmonisatie\n\nToegang tot representatieve gegevens is essentieel voor het ontwikkelen van robuuste klinische AI-modellen. Het delen van gegevens wordt echter vaak belemmerd door toenemende bezorgdheid over privacy, omslachtige juridische overeenkomsten, beperkte middelen of een gebrek aan interoperabiliteit. In deze context is federated learning (FL) naar voren gekomen als een privacybeschermende aanpak die de ontwikkeling van AI-modellen door meerdere instellingen mogelijk maakt door samenwerking te vergemakkelijken zonder dat gegevens hoeven te worden overgedragen.\n\nWe hebben FL voor het eerst toegepast voor een consortium van cohorten met relevante gegevens voor het onderzoek naar dementie (hoofdstukken 2 en 3). Hier beschrijven we de inspanningen om de infrastructuur op te zetten, de interoperabiliteit van gegevens tussen cohorten te garanderen en algoritmen te implementeren. Hieruit bleek hoe complex het is om een FL-samenwerking op te zetten, wat vooral in de beginfase veel inspanning en middelen vergt. Met name de co\u00f6rdinatie en communicatie tussen de deelnemende cohorten, technische verschillen tussen cohorten en het gebrek aan volwassen softwareoplossingen vergden veel tijd en moeite. Hoewel een FL-infrastructuur voordelen biedt voor langdurig gebruik, lijkt het waarborgen van de duurzaamheid ervan complex. Het benutten van de ervaring uit eerdere projecten, het ontwikkelen van robuuste oplossingen en het investeren in de duurzaamheid van bestaande netwerken is essentieel om de druk op middelen, technische expertise en tijdschema's tegen te gaan.\n\nHet waarborgen van compatibiliteit tussen de datasets van de cohorten is een belangrijk aspect voor het succesvol opzetten van het FL-netwerk. Om dit aan te pakken, hebben we een ETL-strategie (Extract, Transform, Load) voorgesteld om de structurele en semantische compatibiliteit van gegevens te garanderen (hoofdstuk 2). We hebben gekozen voor een bestaand common data model (CDM) om de gegevens van het cohort weer te geven en hebben de gegevens gestandaardiseerd volgens een openbaar beschikbare terminologie. Om de herbruikbaarheid van de ETL te bevorderen, hebben we de project-, cohort- en CDM-specifieke metadata ontkoppeld. Dit proces bracht echter obstakels aan het licht die de toekomstige interoperabiliteit kunnen beperken. Met name het onvermogen van een CDM om aan alle vereisten te voldoen en het ontbreken van domeinspecifieke termen in terminologie\u00ebn. Inspanningen van de gemeenschap om consensus te bereiken over richtlijnen en instrumenten voor methoden voor gegevensharmonisatie zijn essentieel om de interoperabiliteit tussen instellingen verder te vergemakkelijken.\n\nMet een operationeel FL-netwerk, hebben we algoritmen ge\u00efmplementeerd voor data-exploratie, lineaire analyse en het trainen van deep learning (DL)-modellen voor alle cohorten. Hoewel dit proces succesvol was, bracht het ook inherente uitdagingen bij het gebruik van FL aan het licht, met name bij het inspecteren van de data, het debuggen van de modellen en het monitoren van de analyse. Bovendien maakte de extra complexiteit van de CDM- en FL-tools de toegankelijkheid voor onderzoekers nog moeilijker. Naast ontwikkeling vereist het bevorderen van de acceptatie van federated learning investeringen in technische training, educatief materiaal en gebruiksvriendelijke tools.\n\nWe hebben FL gebruikt om een op MRI gebaseerd DL-model te trainen voor het voorspellen van een biologische leeftijdsscore die kan dienen als biomarker voor hersenveroudering (hoofdstuk 3). Hiervoor hebben we het model aangepast om iteratief te trainen over meerdere cohorten. Hoewel het DL-model niet kon worden gegeneraliseerd naar externe gegevens wanneer het werd getraind met gegevens van \u00e9\u00e9n enkel cohort, verbeterde de generaliseerbaarheid aanzienlijk door het aan te passen voor training over meerdere cohorten met behulp van het FL-netwerk. Hier bracht de FL-aanpak ook extra uitdagingen aan het licht bij het aanpassen en optimaliseren van de modellen, het ontwikkelen van robuustere softwareoplossingen en het beheren van de gegevens. In een ander onderzoek hebben we vergelijkbare uitdagingen waargenomen. We hebben FL gebruikt om een Bayesiaans netwerk te ontwikkelen voor twee klinieken met relevante gegevens over de behandeling van rectumkanker (hoofdstuk 4). Om zowel de deskundige kennis als de gegevens van de kliniek te benutten, hebben we een nieuw FL-algoritme voorgesteld. Deze aanpak combineerde op effectieve wijze gegevens van beide klinieken om modellen te ontwikkelen die beter presteerden dan modellen die waren getraind op gegevens van \u00e9\u00e9n locatie. De parameteroptimalisatie bleek een grotere uitdaging, omdat de optimale waarden varieerden tussen de uitkomsten en tussen de klinieken.\n\nDeep learning voor medische beeldvorming\n\nDL maakte een verschuiving mogelijk naar automatische feature-extractie en optimalisatie voor medische beeldvorming. Hoewel dit ten koste gaat van de verklaarbaarheid en interpreteerbaarheid, leren deze modellen zeer onderscheidende taakspecifieke features, wat vaak resulteert in betere prestaties. DL-studies missen echter vaak de gedetailleerde rapportage en materialen die nodig zijn om reproduceerbaarheid en repliceerbaarheid te garanderen, wat hun toepasbaarheid en begrip beperkt. We hebben deze uitdagingen aangepakt door de reproduceerbaarheid te evalueren van drie studies waarin DL-modellen worden voorgesteld voor het voorspellen van de uitkomst van hoofd-halskanker (hoofdstuk 5). Geen studie slaagde er in om de informatie te rapporteren die nodig was om hun resultaten nauwkeurig te reproduceren. Vaak ontbraken details over de pre-processing pipeline, de random initialisatoren en een functionele code. Daarom hebben we een van de voorgestelde modellen aangepast en deze uitdagingen aangepakt door checklists te volgen en het model en de pre-processing pipeline te containeriseren. Met aanzienlijk minder parameters presteert ons model beter dan of even goed als bestaande modellen.\n\nDe toepassing van DL op medische beeldvorming bleek effectief te zijn bij het extraheren van kenmerken uit CT-scans voor de prognose van hoofd-halskankerpati\u00ebnten (hoofdstuk 5) en uit MRI-scans voor een biomarker voor hersenveroudering (hoofdstuk 3). Tegelijkertijd werd de aanzienlijke impact van beeldvoorbewerking en multi-institutionele gegevens benadrukt. In beide toepassingen had de voorbewerking een aanzienlijke invloed op het convergentievermogen en de prestaties van het model. Het was essentieel om de voorverwerkingspijplijn tussen instellingen te harmoniseren en te optimaliseren voor de doelweefsels. Bovendien bleek multi-institutionele data belangrijk te zijn voor het verminderen van het risico op overfitting, een veelvoorkomende uitdaging voor DL-modellen die grotere datasets vereisen in vergelijking met traditionele methoden. Hoewel technieken zoals transfer learning de behoefte aan grote datasets kunnen verminderen, blijft hoogwaardige geannoteerde data van cruciaal belang (hoofdstuk 6).\n\nVoorspellingsmodellen voor de kliniek\n\nDe prestaties van een model alleen zijn niet voldoende om de klinische waarde te garanderen. Daarvoor moet het model voorzien in echte klinische behoeften en naadloos aansluiten bij de werkprocessen, prioriteiten en besluitvormingsprocessen van clinici. Met bijzondere nadruk op deze prioriteiten hebben we voorspellingsmodellen ontwikkeld op basis van de input van clinici tijdens het ontwikkelingsproces. Concreet gaat het om een Bayesiaans netwerk om de respons op de behandeling te schatten voor pati\u00ebnten met lokaal gevorderde rectumkanker (hoofdstuk 4) en lineaire modellen voor risicobeoordeling van door straling veroorzaakte neurocognitieve achteruitgang bij pati\u00ebnten met een primaire hersentumor (hoofdstuk 6). Beide modellen leverden veelbelovende resultaten op, hoewel de integratie van gegevens van andere klinieken cruciaal blijft om de bevindingen verder te valideren. Dit is des te belangrijker omdat verschillen tussen klinieken, zoals blijkt uit de twee studies (d.w.z. verschillende behandelingsbeleidslijnen en cognitieve beoordelingen), de ontwikkeling van robuuste modellen kunnen belemmeren. In beide gevallen bleek de interpreteerbaarheid een belangrijk voordeel van de modellen te zijn, wat de dialoog met deskundigen en de integratie in bestaande klinische hulpmiddelen vergemakkelijkte.","summary":"Artificial intelligence (AI) is a crucial pillar in the ongoing pursuit of leveraging healthcare data and providing personalized care to patients. By identifying relevant patterns in data, AI unlocked the potential of the growing collection of complex healthcare data to support the clinical workflow. While promising, the path to clinical integration faces several challenges. These include difficulties in accessing representative data, reproducing proposed models, a lack of generalizability and explainability, and effectively aligning clinical needs and ensuring workflow integration. Overcoming these obstacles is crucial to harnessing the full potential of AI in healthcare.\n\nIn this thesis, we explore AI\u2019s pathway towards clinical integration through practical cases. Specifically, we focus on federated learning to facilitate data sharing and developing generalizable models, using deep learning to leverage medical imaging, and building clinically relevant prediction models. Across these topics, we address challenges hindering progress towards the successful implementation and adoption of AI in healthcare.\n\nFederated Learning & Data Harmonization\n\nAccess to representative data is essential for developing robust clinical AI models. However, data sharing is often hindered by growing privacy concerns, cumbersome legal agreements, resource limitations, or lack of interoperability. In this context, federated learning (FL) emerged as a privacy-preserving approach that enables the development of AI models across multiple institutions by facilitating collaboration without requiring data transfer.\n\nWe first employed FL for a consortium of cohorts with relevant data for the study of dementia (Chapters 2 and 3). Here, we describe the efforts to establish the infrastructure, guarantee data interoperability between cohorts, and implement algorithms. This revealed the complexity of establishing a FL collaboration, which requires significant effort and resources, especially in the initial phase. Most notably, the coordination and communication across participating cohorts, technical discrepancies between cohorts, and lack of mature software solutions demanded considerable time and effort. Although a FL infrastructure benefits long-term usage, ensuring its sustainability appears complex. Leveraging the experience from previous projects, developing robust solutions, and investing in the sustainability of existing networks is essential to counteract the pressure on resources, technical expertise, and timelines.\n\nEnsuring compatibility between the cohorts\u2019 datasets is a key aspect of successfully establishing the FL network. To address this, we proposed an extract, transform, and load (ETL) strategy to guarantee structural and semantic compatibility of data (Chapter 2). We opted for an existing common data model (CDM) to represent the cohort\u2019s data and standardized the data according to a publicly available terminology. To promote reusability of the ETL, we decoupled the project, cohort, and CDM-specific metadata. Nevertheless, this process highlighted obstacles that can limit future interoperability. In particular, a CDM's inability to cover all requirements and the lack of domain-specific terms in terminologies. Community efforts towards consensus on guidelines and tools for data harmonization methods are essential to further facilitate interoperability between institutions.\n\nWith the FL network operational, we implemented algorithms for data exploration, linear analysis, and training deep learning (DL) models across the cohorts. While successful, this process highlighted inherent challenges in using FL, especially with inspecting the data, debugging the models, and monitoring the analysis. In addition, the added complexity of the CDM and FL tools further hindered accessibility to researchers. Beyond development, promoting the adoption of federated learning requires investing in technical training, educational materials, and user-friendly tools.\n\nWe employed FL to train an MRI-based DL model for the prediction of a biological age score that can serve as a biomarker for brain aging (Chapter 3). For this, we adapted the model to train iteratively across multiple cohorts. While the DL model failed to generalize to external data when trained with data from a single cohort, adapting it for training across multiple cohorts using the FL network significantly improved its generalizability. Here, the FL approach also revealed additional challenges in adapting and optimizing the models, developing more robust software solutions, and managing the data. In a different study, we observed similar challenges. We employed FL to develop a Bayesian network for two clinics with relevant data in rectal cancer treatment (Chapter 4). To leverage both the expert knowledge and the clinic\u2019s data, we proposed a novel FL algorithm. This approach effectively combined data from both clinics to develop models that outperformed those trained on data from a single site. The parameter optimization proved more challenging, as optimal values varied across outcomes and between clinics.\n\nDeep learning for medical imaging\n\nDL enabled a shift to automatic feature extraction and optimization for medical imaging. Although compromising the explainability and interpretability, these models learn highly discriminative task-specific features, which often results in better performance. However, DL studies often lack the detailed reporting and materials needed to guarantee reproducibility and replicability, limiting their applicability and understanding. We addressed these challenges by evaluating the reproducibility of three studies proposing DL models for head and neck cancer outcome prediction (Chapter 5). Here, all studies failed to report the information required to reproduce their results accurately, frequently missing details regarding the pre-processing pipeline, the random initializers, and a functional code. Therefore, we adapted one of the proposed models, addressing these challenges by following checklists and containerizing the model and pre-processing pipeline. With substantially fewer parameters, our model either outperforms or matches the performance of existing models.\n\nApplying DL to medical imaging was effective in extracting features from CT scans for the prognosis of head and neck cancer patients (Chapter 5) and from MRI scans for a brain aging biomarker (Chapter 3). Simultaneously, it highlighted the significant impact of imaging pre-processing and multi-institutional data. In both applications, the pre-processing significantly impacted the model\u2019s ability to converge and its performance. Harmonizing the pre-processing pipeline across institutions and optimizing it for the target tissues was essential. Furthermore, multi-institutional data proved instrumental in reducing the risk of overfitting, a common challenge for DL models that require larger datasets compared to traditional methods. Although techniques like transfer learning can mitigate the need for large datasets, high-quality annotated data is still vital (Chapter 6).\n\nPrediction models for the clinic\n\nA model\u2019s performance alone is not enough to ensure clinical value. For that, it must solve real clinical needs and integrate seamlessly with clinicians\u2019 workflows, priorities, and decision-making processes. With particular emphasis on these priorities, we developed prediction models guided by the clinicians\u2019 input throughout the development process. Specifically, a Bayesian network to estimate treatment response for patients with locally advanced rectal cancer (Chapter 4) and linear models for risk assessment of radiation-induced neurocognitive decline in patients with a primary brain tumor (Chapter 6). Both models presented promising results, although integrating data from other clinics remains crucial to further validate the findings. This takes on added importance given that differences between clinics, as seen in the two studies (i.e., distinct treatment policies and cognitive assessments), can hinder the development of robust models. In both cases, interpretability stood out as a key advantage of the models, facilitating the dialogue with experts and integration in existing clinical tools.","auteur":"Pedro Mateus","auteur_slug":"pedro-mateus","publicatiedatum":"12 juni 2026","taal":"EN","url_flipbook":"https:\/\/ebook.proefschriftmaken.nl\/ebook\/pedromateus?iframe=true","url_download_pdf":"https:\/\/ebook.proefschriftmaken.nl\/download\/0b450484-0fdf-4a57-954b-92ccfeb0a4f6\/optimized","url_epub":"","ordernummer":"19094","isbn":"","doi_nummer":"","naam_universiteit":"Universiteit Maastricht","afbeeldingen":15655,"naam_student:":"","binnenwerk":"","universiteit":"Universiteit Maastricht","cover":"","afwerking":"","cover_afwerking":"","design":""},"_links":{"self":[{"href":"https:\/\/www.proefschriftmaken.nl\/en\/wp-json\/wp\/v2\/us_portfolio\/15653","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.proefschriftmaken.nl\/en\/wp-json\/wp\/v2\/us_portfolio"}],"about":[{"href":"https:\/\/www.proefschriftmaken.nl\/en\/wp-json\/wp\/v2\/types\/us_portfolio"}],"author":[{"embeddable":true,"href":"https:\/\/www.proefschriftmaken.nl\/en\/wp-json\/wp\/v2\/users\/7"}],"replies":[{"embeddable":true,"href":"https:\/\/www.proefschriftmaken.nl\/en\/wp-json\/wp\/v2\/comments?post=15653"}],"version-history":[{"count":1,"href":"https:\/\/www.proefschriftmaken.nl\/en\/wp-json\/wp\/v2\/us_portfolio\/15653\/revisions"}],"predecessor-version":[{"id":15656,"href":"https:\/\/www.proefschriftmaken.nl\/en\/wp-json\/wp\/v2\/us_portfolio\/15653\/revisions\/15656"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.proefschriftmaken.nl\/en\/wp-json\/wp\/v2\/media\/15654"}],"wp:attachment":[{"href":"https:\/\/www.proefschriftmaken.nl\/en\/wp-json\/wp\/v2\/media?parent=15653"}],"wp:term":[{"taxonomy":"us_portfolio_category","embeddable":true,"href":"https:\/\/www.proefschriftmaken.nl\/en\/wp-json\/wp\/v2\/us_portfolio_category?post=15653"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}