De AI-doorbraak waarmee ziekenhuizen algoritmen kunnen trainen zonder patiëntgegevens te delen

De auteurs: Nicola Rieke Jonny Hancox Wenqi Li Fausto Milletarì Holger R. Roth Shadi Albarqouni Spyridon Bakas Mathieu N. Galtier Bennett A. Landman Klaus Maier-Hein Sébastien Ourselin met Micah Sheller Ronald M. Summers Andrew Trask Daguang Xu Maximilian Baust M. Jorge Cardoso De auteurs: Nicola Rieke met Jonny Hancox Wenen Li Fausto Milletarí door Holger R. Roth Shadi Albarqouni Spyridon Bakas van Mathieu N. Galtier van Bennett A. Landman van Klaus Maier-Hein Sébastien Ourselin met Micah Sheller van Ronald M. Summers Andrew Trask Daguang Xu Maximilian Baust De heer Jorge Cardoso Abstractie Data-driven machine learning (ML) is ontstaan als een veelbelovende benadering voor het bouwen van nauwkeurige en robuuste statistische modellen uit medische gegevens, die in enorme hoeveelheden worden verzameld door moderne gezondheidszorgsystemen. Bestaande medische gegevens worden niet volledig benut door ML vooral omdat het zit in data silos en privacy zorgen beperken de toegang tot deze gegevens. Echter, zonder toegang tot voldoende gegevens, zal ML worden voorkomen dat het zijn volledige potentieel te bereiken en, uiteindelijk, van het maken van de overgang van onderzoek naar klinische praktijk. Dit document beschouwt de belangrijkste factoren die bijdragen aan dit probleem, onderzoekt hoe federated learning (FL) een oplossing voor de toekomst van digitale gezondheid kan bieden en benadrukt de uitdagingen en overwegingen die moeten worden aangepakt. Introductie Onderzoek naar kunstmatige intelligentie (AI), en met name de vooruitgang in machine learning (ML) en deep learning (DL) Moderne DL-modellen bevatten miljoenen parameters die moeten worden geleerd uit voldoende grote gecurateerde datasets om klinische nauwkeurigheid te bereiken, terwijl ze veilig, eerlijk, eerlijk en goed tot onzichtbare gegevens generaliseren , , , . 1 2 3 4 5 Het trainen van een op AI gebaseerde tumordetector vereist bijvoorbeeld een grote database die het volledige spectrum van mogelijke anatomieën, pathologieën en invoergegevenstypen omvat. Zelfs als gegevensanonymisatie deze beperkingen zou kunnen omzeilen, is het nu goed begrepen dat het verwijderen van metagegevens zoals de naam van de patiënt of de geboortedatum vaak niet voldoende is om privacy te behouden. Het is bijvoorbeeld mogelijk om het gezicht van een patiënt te reconstrueren van computertomografie (CT) of magnetische resonantie (MRI) gegevens. Een andere reden waarom het delen van gegevens niet systematisch is in de gezondheidszorg is dat het verzamelen, cureren en onderhouden van een hoogwaardige dataset aanzienlijke tijd, inspanning en kosten kost. 6 7 8 Federatief leren (FL) , , is een leerparadigma dat het probleem van gegevensbeheersing en privacy probeert aan te pakken door algoritmen samen te trainen zonder de gegevens zelf uit te wisselen. , het heeft onlangs aantrekkingskracht op gezondheidszorgtoepassingen , , , , , , , FL maakt het mogelijk om inzichten samen te verwerven, bijvoorbeeld in de vorm van een consensusmodel, zonder patiëntgegevens buiten de firewalls van de instellingen waar ze wonen te verplaatsen. Recent onderzoek heeft aangetoond dat modellen getraind door FL prestaties kunnen bereiken die vergelijkbaar zijn met die getraind op centraal gehost data sets en beter dan modellen die alleen geïsoleerde single-institutionele gegevens zien , . 9 10 11 12 13 14 15 16 17 18 19 20 1 16 17 De typische FL-werkstroom waarbij een federatie van trainingsknooppunten het wereldwijde model ontvangt, hun gedeeltelijk getrainde modellen intermitterend naar een centrale server verzendt voor aggregatie en vervolgens de training voortzet op het consensusmodel dat de server retourneert. FL peer to peer - alternatieve formulering van FL waarin elke trainingsknoop zijn gedeeltelijk getrainde modellen uitwisselt met sommige of al zijn collega's en elk zijn eigen aggregatie doet. Gecentraliseerde training – de algemene niet-FL training workflow waarin gegevensverwervende sites hun gegevens doneren aan een centraal gegevensmeer waaruit zij en anderen gegevens kunnen extraheren voor lokale, onafhankelijke training. a b c Een succesvolle implementatie van FL kan dus een aanzienlijk potentieel hebben om precisiegeneeskunde op grote schaal mogelijk te maken, wat leidt tot modellen die onpartijdige beslissingen maken, optimaal de fysiologie van een individu weerspiegelen en gevoelig zijn voor zeldzame ziekten, terwijl governance- en privacybelangen worden gerespecteerd. We zien een federale toekomst voor digitale gezondheid en met dit perspectiefdocument delen we onze consensus met het doel om context en details te bieden aan de gemeenschap met betrekking tot de voordelen en de impact van FL voor medische toepassingen (sectie "Data-driven geneeskunde vereist federale inspanningen"), evenals de belangrijkste overwegingen en uitdagingen van het implementeren van FL voor digitale gezondheid (sectie "Technische overwegingen"). Data-driven geneeskunde vereist federale inspanningen ML en in het bijzonder DL wordt de de facto kennisontdekkingsbenadering in veel industrieën, maar succesvolle implementatie van data-gedreven toepassingen vereist grote en diverse datasets. echter, medische datasets zijn moeilijk te verkrijgen (subsectie “De afhankelijkheid van gegevens”). FL behandelt dit probleem door het mogelijk maken van collaboratief leren zonder het centraliseren van gegevens (subsectie “De belofte van federale inspanningen”) en heeft al zijn weg gevonden naar digitale gezondheid toepassingen (subsectie “Current FL inspanningen voor digitale gezondheid”). Afhankelijkheid van data Hoewel dit een bekende vereiste is, worden state-of-the-art algoritmen meestal geëvalueerd op zorgvuldig gecurateerde datasets, vaak afkomstig van slechts een paar bronnen. Dit kan vooroordelen introduceren waar demografische gegevens (bijv. geslacht, leeftijd) of technische onevenwichtigheden (bijv. acquisitieprotocol, apparatuurfabrikant) voorspellingen verstoren en de nauwkeurigheid voor bepaalde groepen of locaties nadelig beïnvloeden. De behoefte aan grote databases voor AI-training heeft geleid tot veel initiatieven om gegevens van meerdere instellingen te bundelen.Deze gegevens worden vaak verzameld in zogenaamde Data Lakes.Deze zijn gebouwd met als doel hetzij de commerciële waarde van gegevens te benutten, bijvoorbeeld, IBM's Merge Healthcare-overname , of als een bron voor economische groei en wetenschappelijke vooruitgang, bijvoorbeeld, NHS Scotland's National Safe Haven Franse gezondheidsgegevenshub Health Data Research Verenigd Koninkrijk . 21 22 23 24 Belangrijke, hoewel kleinere, initiatieven omvatten de Human Connectome De Britse Biobank Het Cancer Imaging Archive (TCIA) Nieuwe CXR8 NIH DeepLesion Het Cancer Genome Atlas (TCGA) Het Alzheimer Neuroimaging Initiative (ADNI) Ook de grote medische uitdagingen Zoals de Camelyon Challenge Internationale Multimodale Brain Tumor Segmentatie (BraTS) , , De medische segmentatie Decathlon Openbare medische gegevens zijn meestal taak- of ziekte-specifieke en worden vaak vrijgegeven met verschillende graden van licentie-beperkingen, soms het beperken van de exploitatie. 25 26 27 28 29 30 31 32 33 34 35 36 37 Het centraliseren of vrijgeven van gegevens brengt echter niet alleen regelgevende, ethische en wettelijke uitdagingen met zich mee met betrekking tot privacy en gegevensbescherming, maar ook technische uitdagingen.Anonymisatie, toegangscontrole en veilige overdracht van gezondheidszorggegevens is een niet-triviale en soms onmogelijke taak.Anonieme gegevens uit het elektronische gezondheidsregister kunnen onschadelijk lijken en voldoen aan de GDPR/PHI, maar slechts een paar gegevenselementen kunnen de heridentificatie van patiënten mogelijk maken. Hetzelfde geldt voor genomische gegevens en medische beelden waardoor ze zo uniek zijn als een vingerafdruk. Daarom kan, tenzij het anonimisatieproces de betrouwbaarheid van de gegevens vernietigt, waarschijnlijk nutteloos maakt, patiëntheridentificatie of informatie lekken niet worden uitgesloten.Gate-access voor goedgekeurde gebruikers wordt vaak voorgesteld als een vermoedelijke oplossing voor dit probleem. 7 38 De belofte van de federale inspanningen De belofte van FL is eenvoudig – om de privacy- en data governance-uitdagingen aan te pakken door ML uit niet-co-located data mogelijk te maken. In een FL-instelling definieert elke gegevensbeheerder niet alleen zijn eigen governance-processen en bijbehorende privacybeleid, maar controleert ook de toegang tot gegevens en heeft de mogelijkheid om deze te herroepen. Dit omvat zowel de training als de validatiefase. Op deze manier kan FL nieuwe kansen creëren, bijvoorbeeld door grootschalige, in-institutionele validatie toe te staan of door nieuw onderzoek naar zeldzame ziekten mogelijk te maken, waarbij de incidenten laag zijn en de datasets bij elke instelling te klein zijn. Het verplaatsen van het model naar de gegevens en niet omgekeerd heeft een ander belangrijk voordeel: hoge-dimensionale, opslag Zoals weergegeven in Fig. , een FL-werkstroom kan worden gerealiseerd met verschillende topologieën en berekeningsplannen.De twee meest voorkomende voor gezondheidszorgtoepassingen zijn via een aggregatieserver , , en peer to peer benaderingen , In alle gevallen biedt FL impliciet een zekere mate van privacy, omdat FL-deelnemers nooit rechtstreeks toegang krijgen tot gegevens van andere instellingen en alleen modelparameters ontvangen die over meerdere deelnemers worden geaggregeerd. , , , Daarom zijn mechanismen zoals differentiële privacy , of leren van versleutelde gegevens is voorgesteld om de privacy in een FL-instelling verder te verbeteren (zie rubriek “Technische overwegingen”). en FL technieken zijn een groeiende onderzoeksgebied , . 2 16 17 18 15 39 40 41 42 43 44 45 46 12 20 FL topologies—communication architecture of a federation. Centraal: de aggregatie-server coördineert de training iteraties en verzamelt, aggregeert en distribueert de modellen naar en van de Training Nodes (Hub & Spoke). Decentraliseerd: elke trainingsknooppunt is verbonden met een of meer peers en aggregatie vindt op elke knoop parallel plaats. Hierarchisch: federatieve netwerken kunnen worden samengesteld uit verschillende subfederaties, die kunnen worden gebouwd uit een mix van Peer-to-Peer- en Aggregation Server-federaties ( FL computationele plannen – trajectuur van een model over meerdere partners. Sequentiële training / cyclisch transferleren. Aggregatie van server, Peer naar peer. a b c d e f g Huidige FL-inspanningen voor digitale gezondheid Aangezien FL een algemeen leerparadigma is dat de vereiste voor het bundelen van gegevens voor de ontwikkeling van AI-modellen verwijdert, omvat het toepassingsbereik van FL het gehele toepassingsgebied van AI voor de gezondheidszorg. In de context van elektronische gezondheidsverslagen (EHR) helpt FL bijvoorbeeld om klinisch vergelijkbare patiënten te vertegenwoordigen en te vinden. , , evenals het voorspellen van hospitalisaties als gevolg van hart- en vaatziekten Sterfte en ICU verblijftijd De toepasbaarheid en voordelen van FL zijn ook aangetoond op het gebied van medische beeldvorming, voor gehele hersensegmentatie in MRI , evenals segmentatie van hersentumoren , Onlangs is de techniek gebruikt voor fMRI classificatie om betrouwbare ziekte gerelateerde biomarkers te vinden. en voorgesteld als een veelbelovende aanpak in de context van COVID-19 . 13 47 14 19 15 16 17 18 48 Het is de moeite waard op te merken dat FL-inspanningen overeenkomsten vereisen om de reikwijdte, het doel en de technologie te definiëren die, aangezien het nog nieuw is, moeilijk te bepalen kan zijn. Hieronder vallen consortia die streven naar vooruitgang Onderzoek, zoals het Trustworthy Federated Data Analytics (TFDA) project en het Joint Imaging Platform van het Duitse Cancer Consortium Een ander voorbeeld is een internationale onderzoekssamenwerking die FL gebruikt voor de ontwikkeling van AI-modellen voor de beoordeling van mammogrammen. De studie toonde aan dat de FL-gegenereerde modellen beter presteren dan degenen die zijn opgeleid op de gegevens van een enkel instituut en meer kunnen worden gegeneraliseerd, zodat ze nog steeds goed presteren op de gegevens van andere instituten. Academisch 49 50 51 Door gezondheidszorginstellingen te koppelen, niet beperkt tot onderzoekscentra, kan FL rechtstreeks impact. het lopende HealthChain-project , bijvoorbeeld, is gericht op het ontwikkelen en implementeren van een FL framework in vier ziekenhuizen in Frankrijk. Deze oplossing genereert gemeenschappelijke modellen die behandelingsrespons voor borstkanker en melanoom patiënten kunnen voorspellen. Het helpt oncologen om de meest effectieve behandeling voor elke patiënt te bepalen uit hun histologische dia's of dermoscopie beelden. , dat is een internationale federatie van 30 toegewijde gezondheidszorginstellingen met behulp van een open-source FL framework met een grafische gebruikersinterface. het doel is om tumorgrensdetectie te verbeteren, waaronder hersenglioma, borsttumoren, levertumoren en botlaesies van meerdere myeloompatiënten. Kliniek 52 53 Een ander gebied van invloed is binnen onderzoek en vertaling.FL maakt samenwerkingsonderzoek mogelijk voor zelfs concurrerende bedrijven.In deze context is een van de grootste initiatieven het Melloddy project Het is een project gericht op het implementeren van multi-task FL over de datasets van 10 farmaceutische bedrijven.Door het trainen van een gemeenschappelijk voorspellend model, dat invoert hoe chemische verbindingen binden aan eiwitten, partners van plan om het drug ontdekkingsproces te optimaliseren zonder hun zeer waardevolle interne gegevens te onthullen. industrieel 54 Impact op stakeholders FL omvat een paradigmaverschuiving van gecentraliseerde gegevensmeren en het is belangrijk om de impact ervan op de verschillende stakeholders in een FL-ecosysteem te begrijpen. klinisch Klinische artsen worden meestal blootgesteld aan een subgroep van de bevolking op basis van hun locatie en demografische omgeving, wat vooroordelen kan veroorzaken over de waarschijnlijkheid van bepaalde ziekten of hun onderlinge verbinding. Door ML-gebaseerde systemen te gebruiken, bijvoorbeeld als tweede lezer, kunnen ze hun eigen expertise vergroten met deskundige kennis van andere instellingen, waardoor een consistentie van diagnose vandaag niet kan worden bereikt. Hoewel dit geldt voor ML-gebaseerde systemen in het algemeen, kunnen systemen die op een federale manier zijn opgeleid, mogelijk nog minder vooroordeelende beslissingen en een hogere gevoeligheid voor zeldzame gevallen opleveren, omdat ze waarschijnlijk werden blootgesteld aan een meer complete gegevensdistributie. Patiënten Patiënten worden meestal lokaal behandeld. Het opzetten van FL op een wereldwijde schaal zou een hoge kwaliteit van klinische beslissingen kunnen garanderen, ongeacht de locatie van de behandeling. In het bijzonder kunnen patiënten die medische zorg in afgelegen gebieden nodig hebben, profiteren van dezelfde hoge kwaliteit ML-ondersteunde diagnoses die beschikbaar zijn in ziekenhuizen met een groot aantal gevallen. Hetzelfde geldt voor zeldzame, of geografisch ongebruikelijke, ziekten, die waarschijnlijk mildere gevolgen hebben als snellere en nauwkeuriger diagnoses kunnen worden gemaakt. FL kan ook de belemmering voor het worden van een gegevensdonor verlagen, omdat patiënten kunnen worden verzekerd dat de gegevens bij hun eigen instelling blijven en dat toegang tot gegevens kan worden ingetrokken. Ziekenhuizen en praktijken Ziekenhuizen en praktijken kunnen hun patiëntgegevens volledig beheersen en bezitten met volledige traceerbaarheid van gegevenstoegang, waardoor het risico op misbruik door derden wordt beperkt. Dit vereist echter investeringen in on-premise computing-infrastructuur of de levering van privé-clouddiensten en naleving van gestandaardiseerde en synoptische gegevensformaten, zodat ML-modellen naadloos kunnen worden getraind en geëvalueerd. Onderzoekers en AI ontwikkelaars Onderzoekers en AI-ontwikkelaars profiteren van de toegang tot een potentieel grote verzameling real-world data, die zeker invloed zal hebben op kleinere onderzoekslaboratoria en start-ups.Dus kunnen middelen worden gericht op het oplossen van klinische behoeften en bijbehorende technische problemen in plaats van te vertrouwen op de beperkte aanbod van open datasets. , , FL-gebaseerde ontwikkeling impliceert ook dat de onderzoeker of AI-ontwikkelaar niet alle gegevens kan onderzoeken of visualiseren waarop het model wordt getraind, bijvoorbeeld is het niet mogelijk om naar een individueel falen te kijken om te begrijpen waarom het huidige model er slecht op werkt. 11 12 20 Gezondheidszorgverleners Gezondheidszorgverleners in veel landen worden beïnvloed door de aanhoudende paradigma verschuiving van volume-based, d.w.z. fee-for-service-based, naar waarde-based gezondheidszorg, die op zijn beurt sterk verbonden is met de succesvolle oprichting van precisiegeneeskunde.Dit gaat niet over het bevorderen van duurder geïndividualiseerde therapieën, maar in plaats daarvan over het bereiken van betere resultaten eerder door middel van meer gerichte behandeling, waardoor de kosten worden verlaagd. FL heeft het potentieel om de nauwkeurigheid en robuustheid van gezondheidszorg AI te verhogen, terwijl de kosten worden verlaagd en de resultaten van patiënten worden verbeterd, en kan daarom van vitaal belang zijn voor precisie geneeskunde. fabrikanten Fabrikanten van software en hardware voor de gezondheidszorg kunnen ook profiteren van FL, omdat het combineren van het leren van vele apparaten en toepassingen, zonder patiënt-specifieke informatie te onthullen, de continue validatie of verbetering van hun ML-gebaseerde systemen kan vergemakkelijken. Technische overwegingen FL is misschien wel het best bekend uit het werk van Konečnỳ et al. , maar verschillende andere definities zijn voorgesteld in de literatuur , , , Een FL workflow (Fig. ) kan worden gerealiseerd via verschillende topologieën en computationele plannen (Fig. In deze sectie bespreken we in meer detail wat FL is, evenals de belangrijkste uitdagingen en technische overwegingen die ontstaan bij het toepassen van FL in digitale gezondheid. 55 9 11 12 20 1 2 De definitie van federaal leren FL is a learning paradigm in which multiple parties train collaboratively without the need to exchange or centralise data sets. A general formulation of FL reads as follows: Let denote a global loss function obtained via a weighted combination of lokale verliezen, berekend op basis van privégegevens , die verblijft bij de individuele betrokken partijen en nooit onder hen wordt gedeeld: K xk Waar > 0 geeft de respectieve gewichtscoëfficiënten aan. Wk In de praktijk verkrijgt en verfijnt elke deelnemer meestal een wereldwijd consensusmodel door een paar ronden optimalisatie lokaal uit te voeren en voorafgaand aan het delen van updates, hetzij rechtstreeks, hetzij via een parameterserver. ) , Het werkelijke proces voor het aggregeren van parameters hangt af van de netwerktopologie, aangezien knooppunten kunnen worden gescheiden in subnetwerken vanwege geografische of wettelijke beperkingen (zie Figuur. Aggregatiestrategieën kunnen afhankelijk zijn van een enkele aggregatie knooppunt (hub- en spraakmodellen) of van meerdere knooppunten zonder enige centralisatie. , , terwijl een voorbeeld van gecentraliseerde FL-aggregatie wordt gegeven in Algoritme 1. Merk op dat aggregatiestrategieën niet noodzakelijkerwijs informatie vereisen over de volledige modelupdate; klanten kunnen ervoor kiezen om alleen een subset van de modelparameters te delen ten behoeve van het verminderen van communicatie overhead, zorgen voor een betere privacybehoud of om multi-task learning-algoritmen te produceren die slechts een deel van hun parameters op een federale manier hebben geleerd. 1 9 12 2 15 56 10 Een verenigend kader dat verschillende trainingsschema's mogelijk maakt, kan computingbronnen (gegevens en servers) losmaken van de Zoals weergegeven in Fig. Deze laatste definieert het traject van een model over verschillende partners, dat moet worden getraind en geëvalueerd op specifieke datasets. Computeren plan 2 Uitdagingen en overwegingen Ondanks de voordelen van FL lost het niet alle problemen op die inherent zijn aan het leren van medische gegevens.Een succesvolle modelopleiding hangt nog steeds af van factoren zoals gegevenskwaliteit, bias en standaardisatie Deze kwesties moeten worden opgelost voor zowel federale als niet-federale leerinspanningen via passende maatregelen, zoals zorgvuldige studieontwerp, gemeenschappelijke protocollen voor gegevensverwerving, gestructureerde rapportage en geavanceerde methoden voor het ontdekken van vooroordelen en verborgen stratificatie. , , . 2 11 12 20 Gegevens heterogeniteit Medische gegevens zijn bijzonder divers – niet alleen vanwege de verscheidenheid aan modaliteiten, dimensionaliteit en kenmerken in het algemeen, maar zelfs binnen een specifiek protocol als gevolg van factoren zoals acquisitieverschillen, merk van het medische hulpmiddel of lokale demografieën. FL kan helpen om bepaalde bronnen van vooroordelen aan te pakken door potentieel verhoogde diversiteit van gegevensbronnen, maar een ongelijke gegevensdistributie vormt een uitdaging voor FL-algoritmen en -strategieën, omdat velen onafhankelijk en identiek verspreide (IID) gegevens over de deelnemers aannemen. Ze zijn geneigd om te falen onder deze omstandigheden. , , , deels het doel van samenwerkende leerstrategieën verslaan. Recente resultaten wijzen echter erop dat FL-training nog steeds haalbaar is , zelfs als medische gegevens niet uniform worden verdeeld over de instellingen , of omvat een lokale bias Onderzoek naar dit probleem omvat bijvoorbeeld: Deel-data-sharing strategieën en FL met domein-adaptie Een andere uitdaging is dat heterogeniteit van gegevens kan leiden tot een situatie waarin de globale optimale oplossing mogelijk niet optimaal is voor een individuele lokale deelnemer. Fedaal 9 9 57 58 59 16 17 51 FedProx 57 58 18 Privacy and security Gezondheidszorggegevens zijn uiterst gevoelig en moeten dienovereenkomstig worden beschermd volgens passende vertrouwelijkheidsprocedures.Daarom zijn enkele van de belangrijkste overwegingen de compromissen, strategieën en resterende risico's met betrekking tot het privacy-behoudspotentieel van FL. Privacy versus prestaties: het is belangrijk op te merken dat FL niet alle mogelijke privacyproblemen oplost en – vergelijkbaar met ML-algoritmen in het algemeen – altijd enkele risico’s met zich meebrengt. Er is echter een compromis in termen van prestaties en deze technieken kunnen bijvoorbeeld de nauwkeurigheid van het eindmodel beïnvloeden. Bovendien kunnen toekomstige technieken en/of bijkomende gegevens worden gebruikt om een model dat voorheen als laag risico werd beschouwd, in gevaar te brengen. 12 10 Vertrouwensniveau: In het algemeen kunnen deelnemende partijen twee soorten FL-samenwerking aangaan: —Voor FL-consortia waarin alle partijen als betrouwbaar worden beschouwd en gebonden zijn aan een uitvoerbare samenwerkingsovereenkomst, kunnen we veel van de meer schadelijke motivaties elimineren, zoals opzettelijke pogingen om gevoelige informatie te extraheren of het model opzettelijk te corruperen. vertrouwde —In FL-systemen die op grotere schaal werken, kan het onpraktisch zijn om een uitvoerbare samenwerkingsovereenkomst vast te stellen. Sommige klanten kunnen opzettelijk proberen de prestaties te verminderen, het systeem naar beneden te brengen of informatie van andere partijen te extraheren.Daarom zullen beveiligingsstrategieën nodig zijn om deze risico's te verminderen, zoals geavanceerde codering van modelvoorstellen, veilige authenticatie van alle partijen, traceerbaarheid van acties, differentiële privacy, verificatiesystemen, uitvoeringsechtheid, modelprivacy en bescherming tegen vijandelijke aanvallen. Niet-vertrouwde Informatielekken: FL-systemen vermijden per definitie het delen van gezondheidszorggegevens tussen deelnemende instellingen.De gedeelde informatie kan echter nog steeds indirect privégegevens blootstellen die worden gebruikt voor lokale training, bijvoorbeeld door modelinversie van de modelupdates, de gradiënten zelf Of tegenstanders aanvallen , FL verschilt van traditionele training doordat het trainingsproces wordt blootgesteld aan meerdere partijen, waardoor het risico op lekken via reverse-engineering toeneemt als tegenstanders modelveranderingen kunnen observeren in de loop van de tijd, specifieke modelupdates kunnen observeren (d.w.z. de update van een enkele instelling) of het model kunnen manipuleren (bijv. door aanvallen in gradient-ascent-stijl extra memorisatie door anderen te induceren). , en het waarborgen van adequate differentiële privacy kan nodig zijn en is nog steeds een actief onderzoeksgebied . 60 61 62 63 16 18 44 12 Traceerbaarheid en verantwoordingsplicht Zoals bij alle veiligheidskritische toepassingen is de reproduceerbaarheid van een systeem belangrijk voor FL in de gezondheidszorg. In tegenstelling tot gecentraliseerde training vereist FL multi-party-berekeningen in omgevingen die aanzienlijke verscheidenheid in termen van hardware, software en netwerken vertonen. Traceerbaarheid van alle systeemactiva, waaronder gegevenstoegangshistorie, trainingsconfiguraties en hyperparameter-tuning gedurende de trainingsprocessen is dus verplicht. In het bijzonder in niet-vertrouwde federaties vereisen traceerbaarheid en verantwoordingsprocessen implementatie-integriteit. Nadat het trainingsproces de onderling overeengekomen modeloptimalisatiecriteria heeft bereikt, kan het ook nuttig zijn om de bijdrage van elke deelnemer te meten Een implicatie van FL is dat onderzoekers niet in staat zijn om gegevens te onderzoeken op basis waarvan modellen worden getraind om onverwachte resultaten te betekenen. Bovendien moet het nemen van statistische metingen van hun trainingsgegevens als onderdeel van de modelontwikkelingswerkstroom door de samenwerkende partijen worden goedgekeurd als niet inbreuk maken op privacy. Hoewel elke site toegang heeft tot zijn eigen ruwe gegevens, kunnen federaties besluiten om een soort beveiligde intra-node-weergavefaciliteit te bieden om aan deze behoefte te voldoen of een andere manier te bieden om de verklarbaarheid en interpretabiliteit van het wereldwijde model te vergroten. 64 Systeemarchitectuur In tegenstelling tot het uitvoeren van grootschalige FL onder consumentenapparaten zoals McMahan et al. Deze unieke kenmerken van FL in de gezondheidszorg brengen ook uitdagingen met zich mee, zoals het waarborgen van gegevensintegriteit bij het communiceren met redundante knooppunten, het ontwerpen van veilige encryptiemethoden om gegevenslekken te voorkomen, of het ontwerpen van geschikte knooppuntenplanner om het beste gebruik te maken van de gedistribueerde computationele apparaten en de leegtijd te verminderen. 9 De administratie van een dergelijke federatie kan op verschillende manieren worden gerealiseerd. In situaties die de strengste gegevensprivacy tussen partijen vereisen, kan de training via een soort "eerlijke makelaar" -systeem werken, waarbij een vertrouwde derde als tussenpersoon optreedt en de toegang tot gegevens vergemakkelijkt. Deze configuratie vereist een onafhankelijke entiteit die het totale systeem beheert, wat misschien niet altijd wenselijk is, omdat het extra kosten en procedurele viscositeit kan met zich meebrengen. Het heeft echter het voordeel dat de precieze interne mechanismen van de cliënten kunnen worden geabstraheerd, waardoor het systeem agiler en gemakkelijker kan worden bijgewerkt. In een peer-to-peer-systeem kan elke site rechtstreeks met sommige of alle andere deelnemers communiceren. Met andere wo Conclusie ML, en in het bijzonder DL, heeft geleid tot een breed scala aan innovaties op het gebied van digitale gezondheidszorg. Aangezien alle ML-methoden enorm profiteren van de mogelijkheid om toegang te krijgen tot gegevens die de ware wereldwijde distributie benaderen, is FL een veelbelovende benadering om krachtige, nauwkeurige, veilige, robuuste en onbevooroordeelde modellen te verkrijgen. Door meerdere partijen in staat te stellen samen te trainen zonder dat ze gegevens moeten uitwisselen of centraliseren, behandelt FL zorgvuldig kwesties met betrekking tot de opkomst van gevoelige medische gegevens. Als gevolg hiervan kan het nieuwe onderzoeks- en zakelijke wegen openen en heeft het potentieel om patiëntenzorg wereldwijd te verbeteren. Echter, al vandaag heeft FL een impact Ondanks dit geloven we echt dat de potentiële impact op precisiegeneeskunde en uiteindelijk de verbetering van de medische zorg zeer veelbelovend is. 12 Rapporteren Samenvatting Meer informatie over het onderzoeksontwerp is beschikbaar in de gelinkt aan dit artikel. Nature Research samenvatting Referenties LeCun, Y., Bengio, Y. & Hinton, G. Deep learning. , 436 (2015). Nature 521 Wang, F., Casalino, L. P. & Khullar, D. Deep learning in medicine—promise, progress, and challenges. , 293–294 (2019). JAMA Intern. Med. 179 Chartrand, G. et al. Deep learning: a primer for radiologists. , 2113–2131 (2017). Radiographics 37 De Fauw, J. et al. Clinically applicable deep learning for diagnosis and referral in retinal disease. , 1342 (2018). Nat. Med. 24 Sun, C., Shrivastava, A., Singh, S. & Gupta, A. Revisiting unreasonable effectiveness of data in deep learning era. In , 843–852 ( , 2017). Proceedings of the IEEE international conference on computer vision IEEE Van Panhuis, W. G. et al. A systematic review of barriers to data sharing in public health. , 1144 (2014). BMC Public Health 14 Rocher, L., Hendrickx, J. M. & De Montjoye, Y.-A. Estimating the success of re-identifications in incomplete datasets using generative models. , 1–9 (2019). Nat. Commun. 10 Schwarz, C. G. et al. Identification of anonymous mri research participants with face-recognition software. , 1684–1686 (2019). N. Engl. J. Med. 381 McMahan, B., Moore, E., Ramage, D., Hampson, S. & y Arcas, B. A. Communication-efficient learning of deep networks from decentralized data. In , 1273–1282. (2017). Artificial Intelligence and Statistics https://scholar.google.de/scholar?hl=de&as_sdt=0%2C5&q=Communicationefficient+learning+of+deep+networks+from+decentralized+data&btnG= Li, T., Sahu, A. K., Talwalkar, A. & Smith, V. Federated learning: Challenges, methods, and future directions. , 50–60 (IEEE, 2020). IEEE Signal Processing Magazine 37 Yang, Q., Liu, Y., Chen, T. & Tong, Y. Federated machine learning: concept and applications. , 12 (2019). ACM Trans. Intell. Syst. Technol. (TIST) 10 Kairouz, P. et al. Advances and open problems in federated learning. (2019). arXiv preprint arXiv:1912.04977 Lee, J. et al. Privacy-preserving patient similarity learning in a federated environment: development and analysis. , e20 (2018). JMIR Med. Inform. 6 Brisimi, T. S. et al. Federated learning of predictive models from federated electronic health records. , 59–67 (2018). Int. J. Med. Inform. 112 Roy, A. G., Siddiqui, S., Pölsterl, S., Navab, N. & Wachinger, C. Braintorrent: a peer-to-peer environment for decentralized federated learning. (2019). arXiv preprint arXiv:1905.06731 Li, W. et al. Privacy-preserving federated brain tumour segmentation. In , 133–141 (Springer, 2019). International Workshop on Machine Learning in Medical Imaging Sheller, M. J., Reina, G. A., Edwards, B., Martin, J. & Bakas, S. Multi-institutional deep learning modeling without sharing patient data: a feasibility study on brain tumor segmentation. In , 92–104 (Springer, 2018). International MICCAI Brainlesion Workshop Li, X. et al. Multi-site fmri analysis using privacy-preserving federated learning and domain adaptation: abide results. (2020). arXiv preprint arXiv:2001.05647 Huang, L. et al. Patient clustering improves efficiency of federated machine learning to predict mortality and hospital stay time using distributed electronic medical records. , 103291 (2019). J. Biomed. Inform. 99 Xu, J. & Wang, F. Federated learning for healthcare informatics. (2019). arXiv preprint arXiv:1911.06270 Roy, A. & Banerjee, A. Ibm’s merge healthcare acquisitio . (2015) (Accessed 10 February 2020). n https://www.reuters.com/article/us-merge-healthcare-m-a-ibm/ibm-to-buy-merge-healthcare-in-1-billion-deal-idUSKCN0QB1ML20150806 Nhs scotland’s national safe haven. (2015) (Accessed 10 February 2020). https://www.gov.scot/publications/charter-safe-havens-scotland-handling-unconsented-data-national-health-service-patient-records-support-research-statistics/pages/4/ Cuggia, M. & Combes, S. The french health data hub and the german medical informatics initiatives: Two national projects to promote data sharing in healthcare. , 195–202 (2019). Yearbook Med. Informat. 28 Health Data Research UK. (Health Data Research UK, 2020) (Accessed 10 Feb 2020). https://www.hdruk.ac.uk/ Sporns, O., Tononi, G. & Kötter, R. The human connectome: a structural description of the human brain. . , e42, (2005). PLoS Comput. Biol 1 https://doi.org/10.1371/journal.pcbi.0010042 Sudlow, C. et al. Uk biobank: an open access resource for identifying the causes of a wide range of complex diseases of middle and old age. . , e1001779. (2015). PLoS Med 12 https://doi.org/10.1371/journal.pmed.1001779 Clark, K. et al. The cancer imaging archive (tcia): maintaining and operating a public information repository. , 1045–1057 (2013). J. Digit. Imaging. 26 Wang, X. et al. Chestx-ray8: Hospital-scale chest X-ray database and benchmarks on weakly-supervised classification and localization of common thorax diseases. In , 2097–2106 ( , 2017). Proceedings of the IEEE conference on computer vision and pattern recognition IEEE Yan, K., Wang, X., Lu, L. & Summers, R. M. Deeplesion: automated mining of large-scale lesion annotations and universal lesion detection with deep learning. , 036501 (2018). J Med. Imaging. 5 Tomczak, K., Czerwińska, P. & Wiznerowicz, M. The cancer genome atlas (tcga): an immeasurable source of knowledge. , A68 (2015). Contemp. Oncol. 19 Jack Jr., C. R. et al. The alzheimer’s disease neuroimaging initiative (adni): Mri methods. , 685–691 (2008). J. Magn. Reson. Imaging 27 . (2020) (Accessed 24 July 2020). Grand Challenge-a Platform for End-to-end Development of Machine Learning Solutions in Biomedical Imaging https://grand-challenge.org/ Litjens, G. et al. 1399 h&e-stained sentinel lymph node sections of breast cancer patients: the camelyon dataset. , giy065 (2018). GigaScience 7 Menze, B. H. et al. The multimodal brain tumor image segmentation benchmark (brats). , 1993–2024 (2014). IEEE Trans. Med. Imaging 34 Bakas, S. et al. Identifying the best machine learning algorithms for brain tumor segmentation, progression assessment, and overall survival prediction in the brats challenge. (2018). arXiv preprint arXiv:1811.02629 Bakas, S. et al. Advancing the cancer genome atlas glioma MRI collections with expert segmentation labels and radiomic features. , 170117 (2017). Sci. Data 4 Simpson, A. L. et al. A large annotated medical image dataset for the development and evaluation of segmentation algorithms. (2019). arXiv preprint arXiv:1902.09063 Yeh, F.-C. et al. Quantifying differences and similarities in whole-brain white matter architecture using local connectome fingerprints. , e1005203 (2016). PLoS Comput. Biol. 12 Chang, K. et al. Distributed deep learning networks among institutions for medical imaging. , 945–954 (2018). J. Am. Med. Inform. Assoc. 25 Shokri, R., Stronati, M., Song, C. & Shmatikov, V. Membership inference attacks against machine learning models. In , 3-18 (IEEE, 2017). 2017 IEEE Symposium on Security and Privacy (SP) Sablayrolles, A., Douze, M., Ollivier, Y., Schmid, C. & Jégou, H. White-box vs black-box: Bayes optimal strategies for membership inference. In Chaudhuri, K. & Salakhutdinov, R. (eds) , 5558–5567. (PMLR, 2019). Proceedings of the 36th International Conference on Machine Learning, {ICML} 97 http://proceedings.mlr.press/v97/sablayrolles19a.html Zhang, C., Bengio, S., Hardt, M., Recht, B. & Vinyals, O. Understanding deep learning requires rethinking generalization. In , (OpenReview.net, 2017). 5th International Conference on Learning Representations, {ICLR}. https://openreview.net/forum?id=Sy8gdB9xx Carlini, N., Liu, C., Erlingsson, Ú., Kos, J. & Song, D. The secret sharer: evaluating and testing unintended memorization in neural networks. In Heninger, N. & Traynor, P. (eds) { } ({ } , 267–284. ({USENIX} Association, Santa Clara, CA, USA, 2019). 28th USENIX Security Symposium USENIX Security 19 https://www.usenix.org/conference/usenixsecurity19/presentation/carlini Abadi, M. et al. Deep learning with differential privacy. In , 308–318 (ACM, 2016). Proceedings of the 2016 ACM SIGSAC Conference on Computer and Communications Security Shokri, R. & Shmatikov, V. Privacy-preserving deep learning. In , 1310–1321 (ACM, 2015). Proceedings of the 22nd ACM SIGSAC conference on computer and communications security Langlotz, C. P. et al. A roadmap for foundational research on artificial intelligence in medical imaging: from the 2018 nih/rsna/acr/the academy workshop. , 781–791 (2019). Radiology 291 Kim, Y., Sun, J., Yu, H. & Jiang, X. Federated Tensor Factorization for Computational Phenotyping. In . 887–895. (ACM, Halifax, NS, Canada, 2017). Proceedings of the 23rd {ACM} {SIGKDD} International Conference on Knowledge Discoveryand Data Mining https://doi.org/10.1145/3097983.3098118 He, C., Annavaram, M. & Avestimehr, S. Fednas: Federated deep learning via neural architecture search. (2020). https://sites.google.com/view/cvpr20-nas/ Trustworthy federated data analytics (tfda). (2020) (Accessed 28 May 2020). https://tfda.hmsp.center/ Joint Imaging Platform (Jip). (2020) (Accessed 28 May 2020). https://jip.dktk.dkfz.de/jiphomepage/ Medical institutions collaborate to improve mammogram assessment ai. (2020) (Accessed 28 May 2020). https://blogs.nvidia.com/blog/2020/04/15/federated-learning-mammogram-assessment/ Healthchain consortium. (2020) (Accessed 28 May 2020). https://www.substra.ai/en/healthchain-project The federated tumor segmentation (fets) initiative. (2020) (Accessed 28 May 2020). https://www.fets.ai Machine learning ledger orchestration for drug discovery. (2020). Accessed 28 May 2020. https://cordis.europa.eu/project/id/831472 Konečny`, J., McMahan, H. B., Ramage, D. & Richtárik, P. Federated optimization: Distributed machine learning for on-device intelligence. (2016). arXiv preprint arXiv:1610.02527 Lalitha, A., Kilinc, O. C., Javidi, T. & Koushanfar, F. Peer-to-peer federated learning on graphs. (2019). arXiv preprint arXiv:1901.11173 Li, T., Sahu, A. K., Zaheer, M., Sanjabi, M., Talwalkar, A. & Smith, V. Federated optimization in heterogeneous networks. (2018). arXiv preprint arXiv:1812.06127 Zhao, Y. et al. Federated learning with non-iid data. (2018). arxivabs/1806.00582 Li, X., Huang, K., Yang, W., Wang, S. & Zhang, Z. On the convergence of fedavg on non-IID data. (2020). https://openreview.net/forum?id=HJxNAnVtDS Wu, B. et al. P3sgd: patient privacy preserving SGD for regularizing deep CNNs in pathological image classification. In (pp. 2099–2108) (2019). Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition Zhu, L., Liu, Z. & Han, S. Deep leakage from gradients. In Wallach, H. M. et al. (eds) , 14747–14756. (2019). Advances in Neural Information Processing Systems 32: Annual Conference on Neural Information Processing Systems http://papers.nips.cc/paper/9617-deep-leakage-from-gradients Wang, Z. et al. Beyond inferring class representatives: user-level privacy leakage from federated learning. In 2512–2520. (IEEE, Paris, France, 2019). 2019 {IEEE} Conferenceon Computer Communications, {INFOCOM} https://doi.org/10.1109/INFOCOM.2019.8737416 Hitaj, B., Ateniese, G. & Perez-Cruz, F. Deep models under the gan: information leakage from collaborative deep learning. In , CCS’17, 603–618 (Association for Computing Machinery, New York, NY, USA, 2017). Proceedings of the 2017 ACM SIGSAC Conference on Computer and Communications Security Ghorbani, A. & Zou, J. Data shapley: Equitable valuation of data for machine learning. In (pp. 2242-2251) (2019). International Conference on Machine Learning erkenningen This work was supported by the UK Research and Innovation London Medical Imaging & Artificial Intelligence Centre for Value-Based Healthcare, by the Wellcome/EPSRC Centre for Medical Engineering (WT203148/Z/16/Z), by the Wellcome Flagship Programme (WT213038/Z/18/Z), by the Intramural Research Programme of the National Institutes of Health (NIH) Clinical Center, by the National Cancer Institute of the NIH under award number U01CA242871, by the National Institute of Neurological Disorders and Stroke of the NIH under award number R01NS042645, as well as by the Helmholtz Initiative and Networking Fund (project “Trustworthy Federated Data Analytics”) and the PRIME programme of the German Academic Exchange Service (DAAD) with funds from the German Federal Ministry of Education and Research (BMBF). The content and opinions expressed in this publication is solely the responsibility of the authors and do not necessarily represent those of the institutions they are affiliated with, e.g., the U.S. Department of Health and Human Services or the National Institutes of Health. Open access funding provided by Projekt DEAL. Dit document is verkrijgbaar onder de CC by 4.0 Deed (Attribution 4.0 International) licentie. Dit papier is Onder de CC by 4.0 Deed (Attribution 4.0 International) licentie. Beschikbaar in de natuur