AI-genombrottet som låter sjukhus träna algoritmer utan att dela patientdata

Författare : Nicola Rieke Författaren Jonny Hancox och Wenqi Li Fausto Milletarì Författaren Holger R. Roth Shadi Albarqouni Spyridon Bakas Författare: Mathieu N. Galtier Författare: Bennett A. Landman av Klaus Maier-Hein Sébastien Ourselin Micah Sheller Författare: Ronald M. Summers Andrew Trask Daguang Xu Maximilian Baust Ordförande Jorge Cardoso Författare : Nicola Rieke Författaren Jonny Hancox och Wenqi Li Fausto Milletarì Övrigt Författaren Holger R. Roth Shadi Albarqouni Spyridon Bakas Författare: Mathieu N. Galtier Författare: Bennett A. Landman av Klaus Maier-Hein Sébastien Ourselin Micah Sheller Författare: Ronald M. Summers Andrew Trask Daguang Xu Maximilian Baust Ordförande Jorge Cardoso Abstrakt Datadriven maskininlärning (ML) har uppstått som ett lovande tillvägagångssätt för att bygga exakta och robusta statistiska modeller från medicinska data, som samlas in i enorma volymer av moderna hälso- och sjukvårdssystem. Befintliga medicinska data utnyttjas inte fullt ut av ML främst eftersom det sitter i datasilos och sekretessproblem begränsar tillgången till dessa data. Men utan tillgång till tillräckligt med data kommer ML att förhindras från att nå sin fulla potential och i slutändan från att göra övergången från forskning till klinisk praxis. Denna artikel överväger nyckelfaktorer som bidrar till denna fråga, utforskar hur federerat lärande (FL) kan ge en lösning för framtiden för digital hälsa och belyser de utmaningar och överväganden som Introduktion Forskning om artificiell intelligens (AI), och särskilt framstegen inom maskininlärning (ML) och djup inlärning (DL) Moderna DL-modeller innehåller miljontals parametrar som måste läras från tillräckligt stora kurerade dataset för att uppnå klinisk noggrannhet, samtidigt som de är säkra, rättvisa, rättvisa och generaliserar väl till osynliga data , , , . 1 2 3 4 5 Till exempel kräver utbildning av en AI-baserad tumördetektor en stor databas som omfattar hela spektrumet av möjliga anatomier, patologier och inmatningsdata typer. Även om dataanonymisering skulle kunna kringgå dessa begränsningar, är det nu väl förstått att ta bort metadata som patientnamn eller födelsedatum ofta inte är tillräckligt för att bevara integriteten. Det är till exempel möjligt att rekonstruera patientens ansikte från datortomografi (CT) eller magnetisk resonansbildningsdata (MRI). En annan anledning till att datadelning inte är systematisk inom hälso- och sjukvården är att insamling, kurering och underhåll av en högkvalitativ datamängd tar betydande tid, ansträngning och kostnad. Följaktligen kan sådana datamängder ha betydande affärsvärde, vilket gör det mindre troligt att de kommer att delas fritt. 6 7 8 Födererat lärande (FL) , , är ett lärande paradigm som syftar till att ta itu med problemet med datastyrning och integritet genom att träna algoritmer gemensamt utan att utbyta data själv. , det har nyligen vunnit dragkraft för hälso- och sjukvårdstillämpningar , , , , , , , FL gör det möjligt att samarbeta om insikter, t.ex. i form av en konsensusmodell, utan att flytta patientdata bortom brandväggarna i de institutioner där de bor. I stället sker ML-processen lokalt vid varje deltagande institution och endast modellegenskaper (t.ex. parametrar, gradienter) överförs som avbildat i figuren. Ny forskning har visat att modeller som utbildas av FL kan uppnå prestandanivåer jämförbara med de som utbildas på centralt värdade datamängder och överlägsen modeller som bara ser isolerade eninstitutionella data. , . 9 10 11 12 13 14 15 16 17 18 19 20 1 16 17 FL-aggregeringsserver – det typiska FL-arbetsflödet där en federation av träningsnoder får den globala modellen, vidarebefordrar sina delvis utbildade modeller till en central server intermittent för aggregering och sedan fortsätter träningen på konsensusmodellen som servern returnerar. FL peer to peer – alternativ formulering av FL där varje träningsknut utbyter sina delvis utbildade modeller med några eller alla sina kamrater och var och en gör sin egen aggregering. Centraliserad utbildning – det allmänna arbetsflödet för icke-FL-utbildning där dataförvärvande webbplatser donerar sina data till en central datasjö från vilken de och andra kan extrahera data för lokal, oberoende utbildning. a b c Ett framgångsrikt genomförande av FL kan således ha en betydande potential för att möjliggöra precisionsmedicin i stor skala, vilket leder till modeller som ger opartiska beslut, återspeglar en individs fysiologi optimalt och är känsliga för sällsynta sjukdomar samtidigt som man respekterar styrelse- och integritetsfrågor. Vi föreställer oss en federerad framtid för digital hälsa och med detta perspektivpapper delar vi vår konsensus med målet att tillhandahålla sammanhang och detaljer för samhället om fördelarna och effekterna av FL för medicinska tillämpningar (avsnittet ”Data-driven medicin kräver federerade ansträngningar”), samt att lyfta fram viktiga överväganden och utmaningar för att genomföra FL för digital hälsa (avsnittet ”Tekniska överväganden”). Data-driven medicin kräver federerade ansträngningar ML och speciellt DL blir den de facto kunskapsupptäcktsmetoden i många branscher, men framgångsrikt genomförande av datadrivna applikationer kräver stora och mångsidiga datamängder. emellertid är medicinska datamängder svåra att få (underavsnittet ”Beroendet av data”). FL tar itu med detta problem genom att möjliggöra samarbetsinlärning utan att centralisera data (underavsnittet ”Löftet om federerade ansträngningar”) och har redan funnit sin väg till digitala hälsoapplikationer (underavsnittet ”Aktuella FL-insatser för digital hälsa”). Beroende av data Data-driven metoder förlitar sig på data som verkligen representerar den underliggande datafördelningen av problemet. Även om detta är ett välkänt krav, är state-of-the-art algoritmer vanligtvis utvärderas på noggrant kurerade datamängder, ofta härstammar från endast ett fåtal källor. Detta kan introducera fördomar där demografiska (t.ex. kön, ålder) eller tekniska obalanser (t.ex. förvärvsprotokoll, utrustningstillverkare) snedvrida förutsägelser och negativt påverka noggrannheten för vissa grupper eller platser. Behovet av stora databaser för AI-utbildning har gett upphov till många initiativ som syftar till att samla data från flera institutioner. Dessa data samlas ofta i så kallade Data Lakes. Dessa har byggts med målet att utnyttja antingen det kommersiella värdet av data, t.ex. IBM:s förvärv av Merge Healthcare. , eller som en resurs för ekonomisk tillväxt och vetenskaplig utveckling, t.ex. NHS Skottlands National Safe Haven Franska Health Data Hub , och Health Data Research UK . 21 22 23 24 Betydande, om än mindre, initiativ inkluderar Human Connectome Förenade kungariket Biobank Läs omdömen om Cancer Imaging Archive (TCIA) För NIH CXR8 Om NIH DeepLesion Läs mer om Cancer Genome Atlas (TCGA) Alzheimers sjukdom Neuroimaging Initiative (ADNI) samt stora medicinska utmaningar Som Camelyon utmaningen Internationell multimodal hjärntumörsegmentering (BraTS) , , Medicinsk Segmentering Decathlon Offentliga medicinska data är vanligtvis uppgifts- eller sjukdomsspecifika och ofta släpps med olika grader av licensbegränsningar, ibland begränsande dess utnyttjande. 25 26 27 28 29 30 31 32 33 34 35 36 37 Centraliseringen eller frigörandet av data innebär emellertid inte bara regleringsmässiga, etiska och rättsliga utmaningar, relaterade till integritet och dataskydd, utan även tekniska.Anonymisering, kontroll av åtkomst och säker överföring av hälso- och sjukvårdsdata är en icke-trivial och ibland omöjlig uppgift.Anonymiserade data från den elektroniska hälso- och sjukregistret kan tyckas ofarliga och GDPR/PHI-kompatibla, men bara ett fåtal dataelement kan möjliggöra patientens återidentifiering. Detsamma gäller för genomdata och medicinska bilder som gör dem så unika som ett fingeravtryck. Därför kan inte patientens återidentifiering eller läckage av information uteslutas, såvida inte anonymiseringsprocessen förstör dataens trovärdighet, vilket sannolikt gör den värdelös.Gate access för godkända användare föreslås ofta som en hypotetisk lösning på detta problem.Men förutom att begränsa data tillgänglighet är detta endast praktiskt för fall där samtycket från datainnehavarna är ovillkorligt, eftersom det är praktiskt taget omöjligt att återkalla data från dem som kan ha haft tillgång till data. 7 38 Löftet om federala ansträngningar FL:s löfte är enkelt – att ta itu med integritets- och datahanteringsutmaningar genom att möjliggöra ML från icke-co-placerade data. I en FL-inställning definierar varje datakontrollant inte bara sina egna styrprocesser och tillhörande sekretesspolicyer, utan kontrollerar också dataåtkomst och har möjlighet att återkalla den. Detta inkluderar både utbildningen och valideringsfasen. På så sätt kan FL skapa nya möjligheter, t.ex. genom att tillåta storskalig, in-institutionell validering eller genom att möjliggöra ny forskning om sällsynta sjukdomar, där incidenthastigheten är låg och dataset i varje enskild institution är för litet. Att flytta modellen till data och inte tvärtom har en annan stor fördel: högdimensionella, lagringsint Som beskrivs i Fig. Ett FL-arbetsflöde kan realiseras med olika topologier och beräkningsplaner.De två vanligaste för vårdapplikationer är via en aggregeringsserver , , och peer to peer närmar sig , I alla fall erbjuder FL implicit en viss grad av integritet, eftersom FL-deltagarna aldrig direkt får tillgång till data från andra institutioner och endast får modellparametrar som är aggregerade över flera deltagare.I ett FL-arbetsflöde med aggregeringsserver kan de deltagande institutionerna till och med förbli okända för varandra. , , , Därför mekanismer som differentiell integritet , eller lärande från krypterade data har föreslagits för att ytterligare förbättra integriteten i en FL-inställning (se avsnittet ”Tekniska överväganden”). och FL-tekniker är ett växande forskningsområde , . 2 16 17 18 15 39 40 41 42 43 44 45 46 12 20 FL topologier – kommunikationsarkitektur för en federation. Centraliserad: Aggregationsservern samordnar tränings iterationerna och samlar in, aggregerar och distribuerar modellerna till och från träningsnoderna (Hub & Spoke). Decentraliserad: Varje träningsnod är ansluten till en eller flera kamrater och aggregering sker på varje nod parallellt. Hierarkisk: federerade nätverk kan bestå av flera underfederationer, som kan byggas från en blandning av Peer to Peer och Aggregation Server federationer ( FL beräkningsplaner – trajektorin för en modell över flera partner. Sekventiell utbildning / cykliskt överföringsutbildning. Aggregation av servrar, Peer to Peer. a b c d e f g Aktuella FL-insatser för digital hälsa Eftersom FL är ett allmänt lärande paradigm som tar bort kravet på data pooling för AI-modellutveckling, omfattar tillämpningsområdet för FL hela AI för hälso- och sjukvård. Genom att ge en möjlighet att fånga större data variabilitet och analysera patienter över olika demografier, kan FL möjliggöra störande innovationer för framtiden men används också just nu. I samband med elektroniska hälsouppgifter (EHR) hjälper FL till exempel till att representera och hitta kliniskt liknande patienter. , , samt förutsäga sjukhusvistelser på grund av hjärtincidenter , dödlighet och ICU vistelse tid Användbarheten och fördelarna med FL har också visats inom medicinsk bildbehandling, för helhjärnssegmentering i MR. , liksom hjärntumörsegmentering , Nyligen har tekniken använts för fMRI-klassificering för att hitta tillförlitliga sjukdomsrelaterade biomarkörer och föreslogs som ett lovande tillvägagångssätt i samband med COVID-19 . 13 47 14 19 15 16 17 18 48 Det är värt att notera att FL-insatser kräver överenskommelser för att definiera omfattning, syfte och teknik som används som, eftersom de fortfarande är nya, kan vara svåra att definiera. Dessa inkluderar konsortier som syftar till att främja forskning, såsom projektet Trustworthy Federated Data Analytics (TFDA) och den tyska cancerkonsortiets gemensamma bildplattform Ett annat exempel är ett internationellt forskningssamarbete som använder FL för att utveckla AI-modeller för bedömning av mammogram. Studien visade att de FL-genererade modellerna överträffade dem som utbildades på en enskild instituts data och var mer generaliserbara, så att de fortfarande fungerade bra på andra instituts data. akademiska 49 50 51 Genom att koppla samman hälso- och sjukvårdsinstitutioner, inte begränsade till forskningscentra, kan FL ha direkt påverkan. det pågående HealthChain-projektet , till exempel, syftar till att utveckla och distribuera en FL-ram över fyra sjukhus i Frankrike. Denna lösning genererar vanliga modeller som kan förutsäga behandlingssvar för bröstcancer och melanompatienter. Det hjälper onkologer att bestämma den mest effektiva behandlingen för varje patient från sina histologiska bilder eller dermoskopi bilder. , som är en internationell federation av 30 engagerade hälso- och sjukvårdsinstitutioner som använder en öppen källkod FL-ramverk med ett grafiskt användargränssnitt. Målet är att förbättra tumörgränsdetektion, inklusive hjärngliom, brösttumörer, lever tumörer och benskador från flera myelom patienter. Kliniskt 52 53 Ett annat område av påverkan är inom Forskning och översättning. FL möjliggör samarbetsforskning för även konkurrerande företag. I detta sammanhang är ett av de största initiativen Melloddy-projektet. Genom att utbilda en gemensam prediktiv modell, som infererar hur kemiska föreningar binder till proteiner, partners avser att optimera läkemedelsupptäcktsprocessen utan att avslöja sina mycket värdefulla inhemska data. industriella 54 Påverkan på intressenterna FL omfattar ett paradigmskifte från centraliserade datasjöar och det är viktigt att förstå dess inverkan på de olika intressenterna i ett FL-ekosystem. Kliniker Kliniker utsätts vanligtvis för en undergrupp av befolkningen baserat på deras läge och demografiska miljö, vilket kan orsaka partiska antaganden om sannolikheten för vissa sjukdomar eller deras sammankoppling. Genom att använda ML-baserade system, t.ex. som en andra läsare, kan de öka sin egen expertis med expertkunskap från andra institutioner, vilket säkerställer en diagnoskonsistens som inte kan uppnås idag. Även om detta gäller ML-baserade system i allmänhet, kan system som utbildas på ett federerat sätt potentiellt ge ännu mindre partiska beslut och högre känslighet för sällsynta fall eftersom de sannolikt utsätts för en mer fullständig datadistribution. Detta kräver emellertid vissa insatser i förväg såsom överensstämmelse med avtal, t.ex. med avseende på data Patienterna Patienter behandlas vanligtvis lokalt. Att etablera FL på en global skala kan säkerställa högkvalitativa kliniska beslut oavsett behandlingsort. I synnerhet kan patienter som kräver medicinsk vård i avlägsna områden dra nytta av samma högkvalitativa ML-hjälpta diagnoser som finns tillgängliga på sjukhus med ett stort antal fall. Detsamma gäller för sällsynta, eller geografiskt ovanliga, sjukdomar, som sannolikt kommer att ha mildare konsekvenser om snabbare och mer exakta diagnoser kan göras. FL kan också minska hindret för att bli en data donator, eftersom patienter kan försäkras om att uppgifterna förblir hos sin egen institution och dataåtkomst kan återkallas. Sjukhus och praxis Sjukhus och praktiker kan förbli i full kontroll och besittning av sina patientdata med fullständig spårbarhet av dataåtkomst, vilket begränsar risken för missbruk av tredje part. Detta kommer emellertid att kräva investeringar i lokal datarinfrastruktur eller privat molntjänstleverans och efterlevnad av standardiserade och synoptiska dataformat så att ML-modeller kan utbildas och utvärderas sömlöst. Mängden nödvändig beräkningskapacitet beror naturligtvis på om en webbplats endast deltar i utvärderings- och testinsatser eller även i utbildningsinsatser. Även relativt små institutioner kan delta och de kommer fortfarande att dra nytta av kollektiva modeller som genereras. Forskare och AI utvecklare Forskare och AI-utvecklare kan dra nytta av tillgången till en potentiellt stor samling verkliga data, vilket säkert kommer att påverka mindre forskningslaboratorier och nystartade företag. Således kan resurser riktas mot att lösa kliniska behov och tillhörande tekniska problem snarare än att förlita sig på den begränsade tillgången på öppna datamängder. , , FL-baserad utveckling innebär också att forskaren eller AI-utvecklaren inte kan undersöka eller visualisera alla data som modellen är utbildad på, t.ex. är det inte möjligt att titta på ett enskilt misslyckande fall för att förstå varför den nuvarande modellen fungerar dåligt på den. 11 12 20 hälso- och sjukvårdspersonal Hälso- och sjukvårdspersonal i många länder påverkas av det pågående paradigmskiftet från volymbaserad, dvs. avgiftsbaserad, till värdebaserad hälso- och sjukvård, vilket i sin tur är starkt kopplat till den framgångsrika etableringen av precisionsmedicin.Det handlar inte om att främja dyrare individualiserade terapier utan istället om att uppnå bättre resultat tidigare genom mer fokuserad behandling, vilket minskar kostnaderna. tillverkare Tillverkare av hälso- och sjukvårdsprogramvara och hårdvara kan också dra nytta av FL, eftersom kombinationen av lärande från många enheter och applikationer, utan att avslöja patientspecifik information, kan underlätta kontinuerlig validering eller förbättring av sina ML-baserade system. Tekniska överväganden FL är kanske mest känd från arbetet med Konečnỳ et al. , but various other definitions have been proposed in the literature , , , Ett FL arbetsflöde (Fig. ) kan realiseras via olika topologier och beräkningsplaner (Fig. ), but the goal remains the same, i.e., to combine knowledge learned from non-co-located data. In this section, we will discuss in more detail what FL is, as well as highlighting the key challenges and technical considerations that arise when applying FL in digital health. 55 9 11 12 20 1 2 Definition av federalt lärande FL är ett lärande paradigm där flera parter tränar tillsammans utan att behöva utbyta eller centralisera datauppsättningar.En allmän formulering av FL läser så här: Låt beteckna en global förlustfunktion som erhålls genom en vägd kombination av lokala förluster, beräknade från privata data , som är bosatt hos de enskilda berörda parterna och aldrig delas mellan dem: K xk Vart > 0 anger respektive viktkoefficienter. WK I praktiken får och förfinar varje deltagare vanligtvis en global konsensusmodell genom att utföra några rundor av optimering lokalt och innan de delar uppdateringar, antingen direkt eller via en parameterserver. ) , Den faktiska processen för aggregering av parametrar beror på nätverkstopologin, eftersom noder kan separeras till undernät på grund av geografiska eller juridiska begränsningar (se Fig. Aggregationsstrategier kan förlita sig på en enda aggregerande nod (hub och talmodeller), eller på flera noder utan någon centralisering. Ett exempel är peer-to-peer FL, där anslutningar existerar mellan alla eller en undergrupp av deltagarna och modelluppdateringar delas endast mellan direkt anslutna webbplatser. , Observera att aggregeringsstrategier inte nödvändigtvis kräver information om den fullständiga modelluppdateringen; kunder kan välja att dela endast en del av modellparametrarna för att minska kommunikationen överhuvudtaget, säkerställa bättre integritetsbevarande eller att producera multi-task inlärningsalgoritmer som bara har en del av sina parametrar lärt sig på ett federerat sätt. 1 9 12 2 15 56 10 Ett enhetligt ramverk som möjliggör olika utbildningssystem kan separera datorer (data och servrar) från datorn. som framgår av Fig. Den senare definierar trajektorin för en modell över flera partner, som ska utbildas och utvärderas på specifika datamängder. Datorns plan 2 Utmaningar och överväganden Trots fördelarna med FL löser det inte alla problem som är inneboende i att lära sig om medicinska data. En framgångsrik modellutbildning beror fortfarande på faktorer som datakvalitet, bias och standardisering Dessa frågor måste lösas för både federerade och icke-federerade inlärningsinsatser genom lämpliga åtgärder, såsom noggrann studiedesign, gemensamma protokoll för datainsamling, strukturerad rapportering och sofistikerade metoder för att upptäcka bias och dold stratifiering. , , . 2 11 12 20 Data heterogenitet Medicinska data är särskilt varierande – inte bara på grund av mångfalden av modaliteter, dimensionalitet och egenskaper i allmänhet, men även inom ett specifikt protokoll på grund av faktorer som förvärvsklyftor, varumärke av den medicinska enheten eller lokal demografi. FL kan hjälpa till att ta itu med vissa källor till bias genom potentiellt ökad mångfald av datakällor, men ojämn datadistribution utgör en utmaning för FL-algoritmer och strategier, eftersom många antar oberoende och identiskt fördelade (IID) data över deltagarna. är benägna att misslyckas under dessa förhållanden , , , delvis besegra själva syftet med samarbetsinlärningsstrategier. Nyare resultat indikerar dock att FL-utbildning fortfarande är genomförbart , även om medicinska data inte är jämnt fördelade över institutionerna , eller inkluderar en lokal bias . Research addressing this problem includes, for example, Delad data-delningsstrategi och FL med domänanpassning . Another challenge is that data heterogeneity may lead to a situation in which the global optimal solution may not be optimal for an individual local participant. The definition of model training optimality should, therefore, be agreed by all participants before training. Föregående 9 9 57 58 59 16 17 51 FedProx 57 58 18 Integritet och säkerhet Hälso- och sjukvårdsdata är mycket känsliga och måste skyddas i enlighet med lämpliga sekretessförfaranden.Därför är några av de viktigaste övervägandena kompromisser, strategier och återstående risker med avseende på FL:s integritetsbevarande potential. Sekretess vs. prestanda: Det är viktigt att notera att FL inte löser alla potentiella sekretessproblem och – liknande ML-algoritmer i allmänhet – kommer alltid att medföra vissa risker. Det finns dock en kompromiss när det gäller prestanda och dessa tekniker kan påverka till exempel noggrannheten hos den slutliga modellen. Dessutom kan framtida tekniker och/eller biträdande data användas för att äventyra en modell som tidigare ansågs vara lågrisk. 12 10 Nivå av förtroende: I stort sett kan deltagande parter gå in i två typer av FL-samarbete: —För FL-konsortier där alla parter anses vara tillförlitliga och är bundna av ett verkställbart samarbetsavtal, kan vi eliminera många av de mer ogynnsamma motivationerna, såsom avsiktliga försök att extrahera känslig information eller avsiktligt korrupta modellen. förtroende —I FL-system som fungerar i större skala kan det vara opraktiskt att upprätta ett verkställbart samarbetsavtal. Vissa kunder kan medvetet försöka försämra prestanda, bryta ner systemet eller extrahera information från andra parter. Därför kommer säkerhetsstrategier att krävas för att mildra dessa risker, såsom avancerad kryptering av modellinsändningar, säker autentisering av alla parter, spårbarhet av åtgärder, differentiell integritet, verifieringssystem, genomförandets integritet, modellkonfidentialitet och skydd mot motståndarattacker. Oförtroende Informationsläckage: FL-system undviker per definition att dela hälso- och sjukvårdsdata mellan deltagande institutioner.Den delade informationen kan dock fortfarande indirekt avslöja privata data som används för lokal utbildning, t.ex. genom modellinversion. of the model updates, the gradients themselves eller motståndarattacker , . FL is different from traditional training insofar as the training process is exposed to multiple parties, thereby increasing the risk of leakage via reverse-engineering if adversaries can observe model changes over time, observe specific model updates (i.e., a single institution’s update), or manipulate the model (e.g., induce additional memorisation by others through gradient-ascent-style attacks). Developing counter-measures, such as limiting the granularity of the updates and adding noise , och säkerställa tillräcklig differentierad integritet , may be needed and is still an active area of research . 60 61 62 63 16 18 44 12 Spårbarhet och ansvarighet Som för alla säkerhetskritiska applikationer är systemets reproducerbarhet viktigt för FL inom hälso- och sjukvården. Till skillnad från centraliserad utbildning kräver FL multiparty-beräkningar i miljöer som visar betydande variation när det gäller hårdvara, mjukvara och nätverk. Spårbarhet av alla systemtillgångar inklusive dataåtkomsthistorik, träningskonfigurationer och hyperparameterjustering under hela utbildningsprocessen är därför obligatorisk. Särskilt i icke-förtroendefederationer kräver spårbarhet och ansvarighetsprocesser implementeringsintegritet. När utbildningsprocessen når de ömsesidigt överenskomna modelloptimeringskriterierna kan det också vara användbart att mäta mängden bidrag från varje deltagare, såsom beräkningsresurser som förbrukas, kvaliteten på En konsekvens av FL är att forskare inte kan undersöka data på vilka modeller utbildas för att förstå oväntade resultat. Dessutom måste statistiska mätningar av sina utbildningsdata som en del av modellutvecklingsarbetsflödet godkännas av de samarbetsvilliga parterna som inte bryter mot integritet. Även om varje webbplats kommer att ha tillgång till sina egna rådata, kan federationer besluta att tillhandahålla någon form av säker intra-node visningsanläggning för att tillgodose detta behov eller kan ge något annat sätt att öka förklarbarheten och tolkningen av den globala modellen. 64 Systemarkitektur Till skillnad från att köra storskalig FL bland konsumentenheter som McMahan et al. Hälso- och sjukvårdsinstitutionella deltagare är utrustade med relativt kraftfulla beräkningsresurser och tillförlitliga, högre genomströmningsnätverk som möjliggör utbildning av större modeller med många fler lokala träningssteg och delning av mer modellinformation mellan noder.Dessa unika egenskaper hos FL i hälso- och sjukvården medför också utmaningar som att säkerställa dataintegritet när man kommunicerar med redundanta noder, utforma säkra krypteringsmetoder för att förhindra dataläckage eller utforma lämpliga nodplanerare för att göra bästa möjliga utnyttjande av de distribuerade beräkningsenheterna och minska tomgångstiden. 9 Förvaltningen av en sådan federation kan realiseras på olika sätt. I situationer som kräver den strängaste datasekretessen mellan parterna kan utbildningen fungera via ett slags "ärligt mäklare" -system, där en betrodd tredje part fungerar som mellanhand och underlättar tillgången till data. Denna installation kräver en oberoende enhet som kontrollerar det övergripande systemet, vilket kanske inte alltid är önskvärt, eftersom det kan innebära ytterligare kostnader och procedurviscositet. Det har dock fördelen att de exakta interna mekanismerna kan abstraheras från kunderna, vilket gör systemet mer smidigt och enklare att uppdatera. I ett peer-to-peer-system interagerar varje webbplats direkt med några eller alla andra deltagare. Med andra ord finns det ingen gateway-funktion, alla protokoll måste överenskommas Conclusion ML, och särskilt DL, har lett till ett brett spektrum av innovationer inom digital hälso- och sjukvård. Eftersom alla ML-metoder drar stor nytta av möjligheten att få tillgång till data som närmar sig den verkliga globala distributionen, är FL ett lovande tillvägagångssätt för att få kraftfulla, exakta, säkra, robusta och opartiska modeller. Genom att tillåta flera parter att samarbeta utan att behöva utbyta eller centralisera datauppsättningar, tar FL ordentligt upp frågor relaterade till utvinning av känsliga medicinska data. Som ett resultat kan det öppna nya forsknings- och affärsvägar och har potential att förbättra patientvård globalt. Men redan idag har FL en inverkan på nästan alla intressenter och hela behandlingscykeln, allt från förbättrad medicinsk bildanal Trots detta tror vi verkligen att dess potentiella inverkan på precisionsmedicin och i slutändan förbättra sjukvården är mycket lovande. 12 Rapportering sammanfattning Ytterligare information om forskningsdesign finns i länkat till den här artikeln. Nature Research Reporting Summary References LeCun, Y., Bengio, Y. & Hinton, G. Deep learning. , 436 (2015). Nature 521 Wang, F., Casalino, L. P. & Khullar, D. Deep learning in medicine—promise, progress, and challenges. , 293–294 (2019). JAMA Intern. Med. 179 Chartrand, G. et al. Deep learning: a primer for radiologists. , 2113–2131 (2017). Radiographics 37 De Fauw, J. et al. Clinically applicable deep learning for diagnosis and referral in retinal disease. , 1342 (2018). Nat. Med. 24 Sun, C., Shrivastava, A., Singh, S. & Gupta, A. Revisiting unreasonable effectiveness of data in deep learning era. In , 843–852 ( , 2017). Proceedings of the IEEE international conference on computer vision IEEE Van Panhuis, W. G. et al. A systematic review of barriers to data sharing in public health. , 1144 (2014). BMC Public Health 14 Rocher, L., Hendrickx, J. M. & De Montjoye, Y.-A. Estimating the success of re-identifications in incomplete datasets using generative models. , 1–9 (2019). Nat. Commun. 10 Schwarz, C. G. et al. Identification of anonymous mri research participants with face-recognition software. , 1684–1686 (2019). N. Engl. J. Med. 381 McMahan, B., Moore, E., Ramage, D., Hampson, S. & y Arcas, B. A. Communication-efficient learning of deep networks from decentralized data. In , 1273–1282. (2017). Artificial Intelligence and Statistics https://scholar.google.de/scholar?hl=de&as_sdt=0%2C5&q=Communicationefficient+learning+of+deep+networks+from+decentralized+data&btnG= Li, T., Sahu, A. K., Talwalkar, A. & Smith, V. Federated learning: Challenges, methods, and future directions. , 50–60 (IEEE, 2020). IEEE Signal Processing Magazine 37 Yang, Q., Liu, Y., Chen, T. & Tong, Y. Federated machine learning: concept and applications. , 12 (2019). ACM Trans. Intell. Syst. Technol. (TIST) 10 Kairouz, P. et al. Advances and open problems in federated learning. (2019). arXiv preprint arXiv:1912.04977 Lee, J. et al. Privacy-preserving patient similarity learning in a federated environment: development and analysis. , e20 (2018). JMIR Med. Inform. 6 Brisimi, T. S. et al. Federated learning of predictive models from federated electronic health records. , 59–67 (2018). Int. J. Med. Inform. 112 Roy, A. G., Siddiqui, S., Pölsterl, S., Navab, N. & Wachinger, C. Braintorrent: a peer-to-peer environment for decentralized federated learning. (2019). arXiv preprint arXiv:1905.06731 Li, W. et al. Privacy-preserving federated brain tumour segmentation. In , 133–141 (Springer, 2019). International Workshop on Machine Learning in Medical Imaging Sheller, M. J., Reina, G. A., Edwards, B., Martin, J. & Bakas, S. Multi-institutional deep learning modeling without sharing patient data: a feasibility study on brain tumor segmentation. In , 92–104 (Springer, 2018). International MICCAI Brainlesion Workshop Li, X. et al. Multi-site fmri analysis using privacy-preserving federated learning and domain adaptation: abide results. (2020). arXiv preprint arXiv:2001.05647 Huang, L. et al. Patient clustering improves efficiency of federated machine learning to predict mortality and hospital stay time using distributed electronic medical records. , 103291 (2019). J. Biomed. Inform. 99 Xu, J. & Wang, F. Federated learning for healthcare informatics. (2019). arXiv preprint arXiv:1911.06270 Roy, A. & Banerjee, A. Ibm’s merge healthcare acquisitio . (2015) (Accessed 10 February 2020). n https://www.reuters.com/article/us-merge-healthcare-m-a-ibm/ibm-to-buy-merge-healthcare-in-1-billion-deal-idUSKCN0QB1ML20150806 Nhs scotland’s national safe haven. (2015) (Accessed 10 February 2020). https://www.gov.scot/publications/charter-safe-havens-scotland-handling-unconsented-data-national-health-service-patient-records-support-research-statistics/pages/4/ Cuggia, M. & Combes, S. The french health data hub and the german medical informatics initiatives: Two national projects to promote data sharing in healthcare. , 195–202 (2019). Yearbook Med. Informat. 28 Health Data Research UK. (Health Data Research UK, 2020) (Accessed 10 Feb 2020). https://www.hdruk.ac.uk/ Sporns, O., Tononi, G. & Kötter, R. The human connectome: a structural description of the human brain. . , e42, (2005). PLoS Comput. Biol 1 https://doi.org/10.1371/journal.pcbi.0010042 Sudlow, C. et al. Uk biobank: an open access resource for identifying the causes of a wide range of complex diseases of middle and old age. . , e1001779. (2015). PLoS Med 12 https://doi.org/10.1371/journal.pmed.1001779 Clark, K. et al. The cancer imaging archive (tcia): maintaining and operating a public information repository. , 1045–1057 (2013). J. Digit. Imaging. 26 Wang, X. et al. Chestx-ray8: Hospital-scale chest X-ray database and benchmarks on weakly-supervised classification and localization of common thorax diseases. In , 2097–2106 ( , 2017). Proceedings of the IEEE conference on computer vision and pattern recognition IEEE Yan, K., Wang, X., Lu, L. & Summers, R. M. Deeplesion: automated mining of large-scale lesion annotations and universal lesion detection with deep learning. , 036501 (2018). J Med. Imaging. 5 Tomczak, K., Czerwińska, P. & Wiznerowicz, M. The cancer genome atlas (tcga): an immeasurable source of knowledge. , A68 (2015). Contemp. Oncol. 19 Jack Jr., C. R. et al. The alzheimer’s disease neuroimaging initiative (adni): Mri methods. , 685–691 (2008). J. Magn. Reson. Imaging 27 . (2020) (Accessed 24 July 2020). Grand Challenge-a Platform for End-to-end Development of Machine Learning Solutions in Biomedical Imaging https://grand-challenge.org/ Litjens, G. et al. 1399 h&e-stained sentinel lymph node sections of breast cancer patients: the camelyon dataset. , giy065 (2018). GigaScience 7 Menze, B. H. et al. The multimodal brain tumor image segmentation benchmark (brats). , 1993–2024 (2014). IEEE Trans. Med. Imaging 34 Bakas, S. et al. Identifying the best machine learning algorithms for brain tumor segmentation, progression assessment, and overall survival prediction in the brats challenge. (2018). arXiv preprint arXiv:1811.02629 Bakas, S. et al. Advancing the cancer genome atlas glioma MRI collections with expert segmentation labels and radiomic features. , 170117 (2017). Sci. Data 4 Simpson, A. L. et al. A large annotated medical image dataset for the development and evaluation of segmentation algorithms. (2019). arXiv preprint arXiv:1902.09063 Yeh, F.-C. et al. Quantifying differences and similarities in whole-brain white matter architecture using local connectome fingerprints. , e1005203 (2016). PLoS Comput. Biol. 12 Chang, K. et al. Distributed deep learning networks among institutions for medical imaging. , 945–954 (2018). J. Am. Med. Inform. Assoc. 25 Shokri, R., Stronati, M., Song, C. & Shmatikov, V. Membership inference attacks against machine learning models. In , 3-18 (IEEE, 2017). 2017 IEEE Symposium on Security and Privacy (SP) Sablayrolles, A., Douze, M., Ollivier, Y., Schmid, C. & Jégou, H. White-box vs black-box: Bayes optimal strategies for membership inference. In Chaudhuri, K. & Salakhutdinov, R. (eds) , 5558–5567. (PMLR, 2019). Proceedings of the 36th International Conference on Machine Learning, {ICML} 97 http://proceedings.mlr.press/v97/sablayrolles19a.html Zhang, C., Bengio, S., Hardt, M., Recht, B. & Vinyals, O. Understanding deep learning requires rethinking generalization. In , (OpenReview.net, 2017). 5th International Conference on Learning Representations, {ICLR}. https://openreview.net/forum?id=Sy8gdB9xx Carlini, N., Liu, C., Erlingsson, Ú., Kos, J. & Song, D. The secret sharer: evaluating and testing unintended memorization in neural networks. In Heninger, N. & Traynor, P. (eds) { } ({ } , 267–284. ({USENIX} Association, Santa Clara, CA, USA, 2019). 28th USENIX Security Symposium USENIX Security 19 https://www.usenix.org/conference/usenixsecurity19/presentation/carlini Abadi, M. et al. Deep learning with differential privacy. In , 308–318 (ACM, 2016). Proceedings of the 2016 ACM SIGSAC Conference on Computer and Communications Security Shokri, R. & Shmatikov, V. Privacy-preserving deep learning. In , 1310–1321 (ACM, 2015). Proceedings of the 22nd ACM SIGSAC conference on computer and communications security Langlotz, C. P. et al. A roadmap for foundational research on artificial intelligence in medical imaging: from the 2018 nih/rsna/acr/the academy workshop. , 781–791 (2019). Radiology 291 Kim, Y., Sun, J., Yu, H. & Jiang, X. Federated Tensor Factorization for Computational Phenotyping. In . 887–895. (ACM, Halifax, NS, Canada, 2017). Proceedings of the 23rd {ACM} {SIGKDD} International Conference on Knowledge Discoveryand Data Mining https://doi.org/10.1145/3097983.3098118 He, C., Annavaram, M. & Avestimehr, S. Fednas: Federated deep learning via neural architecture search. (2020). https://sites.google.com/view/cvpr20-nas/ Trustworthy federated data analytics (tfda). (2020) (Accessed 28 May 2020). https://tfda.hmsp.center/ Joint Imaging Platform (Jip). (2020) (Accessed 28 May 2020). https://jip.dktk.dkfz.de/jiphomepage/ Medical institutions collaborate to improve mammogram assessment ai. (2020) (Accessed 28 May 2020). https://blogs.nvidia.com/blog/2020/04/15/federated-learning-mammogram-assessment/ Healthchain consortium. (2020) (Accessed 28 May 2020). https://www.substra.ai/en/healthchain-project The federated tumor segmentation (fets) initiative. (2020) (Accessed 28 May 2020). https://www.fets.ai Machine learning ledger orchestration for drug discovery. (2020). Accessed 28 May 2020. https://cordis.europa.eu/project/id/831472 Konečny`, J., McMahan, H. B., Ramage, D. & Richtárik, P. Federated optimization: Distributed machine learning for on-device intelligence. (2016). arXiv preprint arXiv:1610.02527 Lalitha, A., Kilinc, O. C., Javidi, T. & Koushanfar, F. Peer-to-peer federated learning on graphs. (2019). arXiv preprint arXiv:1901.11173 Li, T., Sahu, A. K., Zaheer, M., Sanjabi, M., Talwalkar, A. & Smith, V. Federated optimization in heterogeneous networks. (2018). arXiv preprint arXiv:1812.06127 Zhao, Y. et al. Federated learning with non-iid data. (2018). arxivabs/1806.00582 Li, X., Huang, K., Yang, W., Wang, S. & Zhang, Z. On the convergence of fedavg on non-IID data. (2020). https://openreview.net/forum?id=HJxNAnVtDS Wu, B. et al. P3sgd: patient privacy preserving SGD for regularizing deep CNNs in pathological image classification. In (pp. 2099–2108) (2019). Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition Zhu, L., Liu, Z. & Han, S. Deep leakage from gradients. In Wallach, H. M. et al. (eds) , 14747–14756. (2019). Advances in Neural Information Processing Systems 32: Annual Conference on Neural Information Processing Systems http://papers.nips.cc/paper/9617-deep-leakage-from-gradients Wang, Z. et al. Beyond inferring class representatives: user-level privacy leakage from federated learning. In 2512–2520. (IEEE, Paris, France, 2019). 2019 {IEEE} Conferenceon Computer Communications, {INFOCOM} https://doi.org/10.1109/INFOCOM.2019.8737416 Hitaj, B., Ateniese, G. & Perez-Cruz, F. Deep models under the gan: information leakage from collaborative deep learning. In , CCS’17, 603–618 (Association for Computing Machinery, New York, NY, USA, 2017). Proceedings of the 2017 ACM SIGSAC Conference on Computer and Communications Security Ghorbani, A. & Zou, J. Data shapley: Equitable valuation of data for machine learning. In (pp. 2242-2251) (2019). International Conference on Machine Learning erkännande Detta arbete stöds av UK Research and Innovation London Medical Imaging & Artificial Intelligence Centre for Value-Based Healthcare, avdelningen Wellcome/EPSRC Centre for Medical Engineering (WT203148/Z/16/Z), av Wellcome Flagship Programme (WT213038/Z/18/Z), av Intramural Research Programme of the National Institutes of Health (NIH) Clinical Center, av National Cancer Institute of the NIH under prisnummer U01CA242871, av National Institute of Neurological Disorders and Stroke of the NIH under prisnummer R01NS042645, samt av Helmholtz Initiative and Networking Fund (projektet ”Trustworthy Federated Data Analytics”) och PRIME-programmet för den tyska akademiska utbytestjänsten (DAAD) med medel från det tyska federala ministeriet This paper is under CC by 4.0 Deed (Attribution 4.0 International) license. available on nature This paper is licens enligt CC by 4.0 Deed (Attribution 4.0 International). Tillgänglig i naturen