Die Autoren: Nicola Rieke Jonny Hancox Wenqi Li Fausto Milletarì Holger R. Roth Shadi Albarqouni Spyridon Bakas Mathieu N. Galtier Bennett A. Landman Klaus Maier-Hein Sébastien Ourselin Micah Sheller Ronald M. Summers Andrew Trask Daguang Xu Maximilian Baust M. Jorge Cardoso Die Autoren: Nicola Rieke von Jonny Hancox Wenqi Li von Fausto Milletarì von Holger R. Roth Shadi Albarqouni Spyridon Bakas von Mathieu N. Galtier von Bennett A. Landman Klaus Maier-Hein von Sébastien Ourselin von Micah Sheller von Ronald M. Summers von Andrew Trask Daguang Xu Maximilian Baust von Jorge Cardoso Abstrakte Das datengesteuerte maschinelle Lernen (ML) ist als vielversprechender Ansatz für den Aufbau präziser und robuster statistischer Modelle aus medizinischen Daten entstanden, die in großen Mengen von modernen Gesundheitssystemen gesammelt werden. Bestehende medizinische Daten werden von ML nicht vollständig ausgenutzt, hauptsächlich, weil es in datensilos sitzt und Datenschutzbedenken den Zugang zu diesen Daten einschränken. Ohne Zugang zu ausreichenden Daten wird ML jedoch daran gehindert, sein volles Potenzial zu erreichen und letztendlich den Übergang von der Forschung zur klinischen Praxis zu machen. Dieses Papier betrachtet die Schlüsselfaktoren, die zu diesem Problem beitragen, untersucht, wie federated learning (FL) eine Lösung für die Zukunft der digitalen Einführung Forschung in der künstlichen Intelligenz (KI) und insbesondere die Fortschritte im maschinellen Lernen (ML) und tiefem Lernen (DL) Moderne DL-Modelle verfügen über Millionen von Parametern, die aus ausreichend großen kurierten Datensätzen gelernt werden müssen, um klinische Genauigkeit zu erreichen, während sie sicher, fair, fair und generalisieren gut zu unsichtbaren Daten , , , . 1 2 3 4 5 Zum Beispiel erfordert die Ausbildung eines KI-basierten Tumordetektors eine große Datenbank, die das gesamte Spektrum möglicher Anatomien, Pathologien und Eingabedatentypen umfasst. Selbst wenn Datenanonymisierung diese Einschränkungen umgehen könnte, ist es jetzt gut verstanden, dass das Entfernen von Metadaten wie Patientennamen oder Geburtsdatum oft nicht ausreicht, um die Privatsphäre zu erhalten. Es ist beispielsweise möglich, das Gesicht eines Patienten aus Computertomographie (CT) oder Magnetresonanztomographie (MRT) Daten zu rekonstruieren. Ein weiterer Grund, warum der Datenaustausch in der Gesundheitsversorgung nicht systematisch ist, ist, dass das Sammeln, Kurieren und Aufrechterhalten eines hochwertigen Datensatzes beträchtliche Zeit, Anstrengung und Kosten erfordert. 6 7 8 Federated Learning (FL) ist ein , , ist ein Lernparadigma, das das Problem der Datenverwaltung und der Privatsphäre ansprechen möchte, indem Algorithmen kollaborativ trainiert werden, ohne die Daten selbst auszutauschen. , es hat vor kurzem Zugang zu Gesundheitsanwendungen gewonnen , , , , , , , FL ermöglicht es, Einblicke kollaborativ zu sammeln, z.B. in Form eines Konsensmodells, ohne Patientendaten über die Firewalls der Institutionen, in denen sie wohnen, zu verschieben. Jüngste Forschungen haben gezeigt, dass Modelle, die von FL trainiert werden, Leistungsstufen erreichen können, die mit denen vergleichbar sind, die auf zentral gehosteten Datensätzen trainiert werden, und überlegen sind als Modelle, die nur isolierte Ein-Institutionsdaten sehen. , . 9 10 11 12 13 14 15 16 17 18 19 20 1 16 17 FL Aggregation Server – der typische FL-Workflow, in dem eine Föderation von Trainingsknoten das globale Modell erhält, ihre teilweise trainierten Modelle intermittierend an einen zentralen Server zur Aggregation übermittelt und dann das Training auf dem Konsensmodell fortsetzt, das der Server zurückgibt. FL-Peer-to-Peer-alternative Formulierung von FL, bei der jeder Trainingsknoten seine teilweise ausgebildeten Modelle mit einigen oder allen seiner Peers austauscht und jeder seine eigene Aggregation macht. Zentralisiertes Training – der allgemeine nicht-FL-Training-Workflow, in dem Datenerwerber-Sites ihre Daten an einen zentralen Data Lake spenden, aus dem sie und andere Daten für lokale, unabhängige Schulungen extrahieren können. a b c Eine erfolgreiche Implementierung von FL könnte somit ein erhebliches Potenzial haben, Präzisionsmedizin in großem Maßstab zu ermöglichen, was zu Modellen führt, die unvoreingenommene Entscheidungen treffen, die die Physiologie eines Individuums optimal widerspiegeln und empfindlich auf seltene Krankheiten reagieren und gleichzeitig Governance- und Datenschutzprobleme respektieren. Wir sehen eine föderierte Zukunft für digitale Gesundheit und mit diesem Perspektivpapier teilen wir unsere Konsenssicht mit dem Ziel, der Gemeinschaft Kontext und Details über die Vorteile und Auswirkungen von FL für medizinische Anwendungen zu bieten (Abschnitt „Data-driven medicine requires federated efforts“), sowie die wichtigsten Überlegungen und Herausforderungen der Implementierung von FL für digitale Gesundheit (Abschnitt „Technische Überlegungen“). Datenbasierte Medizin erfordert föderale Anstrengungen ML und vor allem DL wird in vielen Branchen zum de facto Wissensentdeckungsansatz, aber die erfolgreiche Implementierung von datengesteuerten Anwendungen erfordert große und vielfältige Datensätze. Jedoch sind medizinische Datensätze schwer zu erhalten (Unterabschnitt „Die Abhängigkeit von Daten“). FL befasst sich mit diesem Problem, indem es das kollaborative Lernen ohne Zentralisierung von Daten ermöglicht (Unterabschnitt „Das Versprechen föderaler Anstrengungen“) und hat bereits seinen Weg zu digitalen Gesundheitsanwendungen gefunden (Unterabschnitt „Aktuelle FL-Anstrengungen für digitale Gesundheit“). Die Abhängigkeit von Daten Während dies eine bekannte Anforderung ist, werden state-of-the-art Algorithmen in der Regel auf sorgfältig ausgewerteten Datensätzen bewertet, die oft nur aus wenigen Quellen stammen. Dies kann Vorurteile einführen, bei denen Demographie (z. B. Geschlecht, Alter) oder technische Ungleichgewichte (z. B. Erwerbsprotokoll, Gerätehersteller) Vorhersagen verzerren und die Genauigkeit für bestimmte Gruppen oder Standorte beeinträchtigen. Die Notwendigkeit großer Datenbanken für KI-Training hat viele Initiativen zur Sammlung von Daten aus mehreren Institutionen hervorgerufen.Diese Daten werden oft in sogenannte Data Lakes zusammengeführt.Diese wurden mit dem Ziel errichtet, entweder den kommerziellen Wert von Daten zu nutzen, z.B. IBMs Merge Healthcare-Akquisition. , oder als Ressource für wirtschaftliches Wachstum und wissenschaftlichen Fortschritt, z.B. NHS Schottlands National Safe Haven Französisch Gesundheitsdaten-Hub Gesundheitsdatenforschung UK . 21 22 23 24 Wesentliche, wenn auch kleinere Initiativen umfassen den Human Connectome. Die britische Biobank Das Cancer Imaging Archive (TCIA) Die NIH CXR8 mit DeepLesion Der Cancer Genome Atlas (TCGA) Die Alzheimer Neuroimaging Initiative (ADNI) ebenso wie medizinische Herausforderungen Wie bei der Camelion Challenge Internationale Multimodale Segmentierung von Gehirntumoren (BraTS) , , Medizinische Segmentierung Decathlon Öffentliche medizinische Daten sind in der Regel Aufgaben- oder Krankheitsspezifisch und werden oft mit unterschiedlichen Graden von Lizenzbeschränkungen freigegeben, die manchmal ihre Ausbeutung einschränken. 25 26 27 28 29 30 31 32 33 34 35 36 37 Die Zentralisierung oder Freigabe von Daten stellt jedoch nicht nur regulatorische, ethische und rechtliche Herausforderungen im Zusammenhang mit der Privatsphäre und dem Datenschutz dar, sondern auch technische.Anonymisierung, Zugriffskontrolle und sichere Übertragung von Gesundheitsdaten ist eine nicht triviale und manchmal unmögliche Aufgabe. Das gleiche gilt für genomische Daten und medizinische Bilder, die sie so einzigartig machen wie Fingerabdrücke. . Therefore, unless the anonymisation process destroys the fidelity of the data, likely rendering it useless, patient reidentification or information leakage cannot be ruled out. Gated access for approved users is often proposed as a putative solution to this issue. However, besides limiting data availability, this is only practical for cases in which the consent granted by the data owners is unconditional, since recalling data from those who may have had access to the data is practically unenforceable. 7 38 Das Versprechen der föderalen Bemühungen Das Versprechen von FL ist einfach – die Herausforderungen der Privatsphäre und der Datenverwaltung anzugehen, indem ML aus nicht-co-located-Daten ermöglicht wird. In einer FL-Einstellung definiert jeder Datencontroller nicht nur seine eigenen Governance-Prozesse und damit verbundene Datenschutzrichtlinien, sondern kontrolliert auch den Datenzugriff und hat die Fähigkeit, ihn zu widerrufen. Dies umfasst sowohl die Ausbildung als auch die Validierungsphase. Auf diese Weise könnte FL neue Möglichkeiten schaffen, z.B. indem er eine groß angelegte, institutionelle Validierung zulässt oder durch neue Forschungen zu seltenen Krankheiten ermöglicht, bei denen die Incidentraten niedrig sind und die Datensätze in jeder einzelnen Institution zu klein sind. Das Übertragen des Modells auf die Daten Wie in Fig. , ein FL-Workflow kann mit verschiedenen Topologien und Berechnungsplänen realisiert werden.Die beiden häufigsten für Gesundheitsanwendungen sind über einen Aggregationsserver , , und peer to peer nähert sich , In allen Fällen bietet FL implizit ein gewisses Maß an Privatsphäre, da FL-Teilnehmer nie direkt auf Daten von anderen Institutionen zugreifen und nur Modellparameter erhalten, die über mehrere Teilnehmer aggregiert werden.In einem FL-Workflow mit Aggregationsserver können die teilnehmenden Institutionen einander sogar unbekannt bleiben. , , , Mechanismen wie Differential Privacy , oder Lernen aus verschlüsselten Daten wurde vorgeschlagen, um die Privatsphäre in einer FL-Einstellung weiter zu verbessern (siehe Abschnitt „Technische Überlegungen“). und FL-Techniken sind ein wachsendes Forschungsgebiet , . 2 16 17 18 15 39 40 41 42 43 44 45 46 12 20 FL Topologien – Kommunikationsarchitektur einer Föderation. Zentralisiert: Der Aggregationsserver koordiniert die Training-Iterationen und sammelt, aggregiert und verteilt die Modelle zu und von den Training-Nodes (Hub & Spoke). Dezentralisiert: Jeder Trainingsknoten ist mit einem oder mehreren Peers verbunden und die Aggregation erfolgt parallel an jedem Knoten. Hierarchisch: Föderierte Netzwerke können aus mehreren Unterföderationen bestehen, die aus einer Mischung aus Peer-to-Peer- und Aggregationsserver-Föderationen gebaut werden können ( FL-Computing-Pläne – Trajektorie eines Modells über mehrere Partner hinweg. Sequentielles Training / Zyklisches Transferlernen. Aggregation von Server, Peer zu peer. a b c d e f g Aktuelle FL-Anstrengungen für digitale Gesundheit Da FL ein allgemeines Lernparadigma ist, das die Datenzusammenschlussanforderung für die Entwicklung von KI-Modellen beseitigt, erstreckt sich das Anwendungsspektrum von FL auf die gesamte KI für die Gesundheitsversorgung. Durch die Bereitstellung einer Möglichkeit, größere Datenvariabilität zu erfassen und Patienten in verschiedenen Demografien zu analysieren, kann FL störende Innovationen für die Zukunft ermöglichen, wird aber auch jetzt eingesetzt. Im Zusammenhang mit elektronischen Gesundheitsdaten (EHR) hilft FL beispielsweise, klinisch ähnliche Patienten zu repräsentieren und zu finden. , sowie die Vorhersage von Krankenhausaufenthalten aufgrund von Herzinfarktereignissen Sterblichkeit und ICU Aufenthaltszeit Die Anwendbarkeit und Vorteile von FL wurden auch im Bereich der medizinischen Bildgebung für die Segmentierung des gesamten Gehirns in der MRT nachgewiesen. sowie die Segmentierung des Gehirntumors , Vor kurzem wurde die Technik für die fMRI-Klassifizierung eingesetzt, um zuverlässige krankheitsbezogene Biomarker zu finden. und als vielversprechender Ansatz im Kontext von COVID-19 vorgeschlagen . 13 47 14 19 15 16 17 18 48 Es ist erwähnenswert, dass die FL-Anstrengungen Vereinbarungen erfordern, um den Anwendungsbereich, das Ziel und die verwendeten Technologien zu definieren, die, da sie noch neu sind, schwierig zu definieren sein können. Dazu gehören Konsortien, die sich auf die Weiterentwicklung Forschung, wie zum Beispiel das Trustworthy Federated Data Analytics (TFDA) Projekt und die Joint Imaging Platform des Deutschen Krebskonsortiums Ein weiteres Beispiel ist eine internationale Forschungskooperation, die FL zur Entwicklung von KI-Modellen für die Bewertung von Mammogrammen nutzt. Die Studie zeigte, dass die FL-generierten Modelle diejenigen übertrafen, die auf den Daten eines einzelnen Instituts ausgebildet wurden und verallgemeinerter waren, so dass sie immer noch gut auf den Daten anderer Instituten ausführten. akademisch 49 50 51 Durch die Verknüpfung von Gesundheitsinstitutionen, die sich nicht auf Forschungszentren beschränken, kann FL direkt Das laufende HealthChain-Projekt , for example, aims to develop and deploy a FL framework across four hospitals in France. This solution generates common models that can predict treatment response for breast cancer and melanoma patients. It helps oncologists to determine the most effective treatment for each patient from their histology slides or dermoscopy images. Another large-scale effort is the Federated Tumour Segmentation (FeTS) initiative , die eine internationale Föderation von 30 engagierten Gesundheitsinstitutionen ist, die ein Open-Source-FL-Framework mit einer grafischen Benutzeroberfläche verwenden.Das Ziel ist es, die Tumorgrenzenerkennung zu verbessern, einschließlich Gehirngliom, Brusttumoren, Lebertumoren und Knochenverletzungen bei mehreren Myeloma-Patienten. Klinisch 52 53 Ein weiterer Einflussbereich liegt im Forschung und Übersetzung. FL ermöglicht die gemeinsame Forschung auch für konkurrierende Unternehmen.In diesem Zusammenhang ist eines der größten Initiativen das Melloddy-Projekt. Es handelt sich um ein Projekt, das darauf abzielt, Multi-Task-FL in den Datensätzen von 10 Pharmaunternehmen zu implementieren.Durch die Ausbildung eines gemeinsamen Vorhersagemodells, das die Art und Weise, wie chemische Verbindungen sich an Proteine binden, ableitet, beabsichtigen Partner, den Prozess der Arzneimittelentdeckung zu optimieren, ohne ihre hochwertigen internen Daten zu enthüllen. Industrielle 54 Auswirkungen auf Stakeholder FL umfasst einen Paradigmenwechsel von zentralisierten Datenseeren und es ist wichtig, seine Auswirkungen auf die verschiedenen Stakeholder in einem FL-Ökosystem zu verstehen. Kliniker Kliniker sind in der Regel einer Untergruppe der Bevölkerung ausgesetzt, die auf ihren Standort und dem demografischen Umfeld basiert, was zu voreingenommenen Annahmen über die Wahrscheinlichkeit bestimmter Krankheiten oder ihre Wechselbeziehung führen kann. Durch die Verwendung von ML-basierten Systemen, z. B. als zweiter Leser, können sie ihr eigenes Fachwissen mit Fachwissen von anderen Institutionen erweitern, wodurch eine Konsistenz der Diagnose sichergestellt wird, die heute nicht erreicht werden kann. Während dies für das ML-basierte System im Allgemeinen gilt, sind Systeme, die in einer föderierten Weise ausgebildet sind, möglicherweise in der Lage, noch weniger voreingenommene Entscheidungen und eine höhere Empfindlichkeit gegenüber seltenen Fällen zu erzielen, da sie wahrscheinlich einer umfassenderen Daten Patienten Patienten werden in der Regel lokal behandelt. Die Schaffung von FL auf globaler Ebene könnte qualitativ hochwertige klinische Entscheidungen unabhängig vom Behandlungsort gewährleisten. Insbesondere Patienten, die medizinische Betreuung in abgelegenen Gebieten benötigen, könnten von den gleichen qualitativ hochwertigen ML-unterstützten Diagnosen profitieren, die in Krankenhäusern mit einer großen Anzahl von Fällen verfügbar sind. Dasselbe gilt für seltene oder geografisch ungewöhnliche Krankheiten, die wahrscheinlich mildere Folgen haben, wenn schneller und genauer Diagnosen gestellt werden können. FL kann auch die Hürde, ein Datenspender zu werden, verringern, da Patienten versichert werden können, dass die Daten bei ihrer eigenen Institution bleiben und der Datenzugriff widerrufen werden kann. Krankenhäuser und Praktiken Krankenhäuser und Praktiken können in voller Kontrolle und Besitz ihrer Patientendaten mit vollständiger Rückverfolgbarkeit des Datenzugangs bleiben, was das Risiko von Missbrauch durch Dritte begrenzt. Dies erfordert jedoch Investitionen in die On-Premise-Computing-Infrastruktur oder die Bereitstellung von privaten Cloud-Diensten und die Einhaltung standardisierter und synoptischer Datenformate, so dass ML-Modelle nahtlos trainiert und bewertet werden können. Die Menge der erforderlichen Rechenfähigkeit hängt natürlich davon ab, ob eine Website nur an Bewertungs- und Testmaßnahmen oder auch an Schulungsmaßnahmen teilnimmt. Forscher und AI-Entwickler Forscher und KI-Entwickler profitieren vom Zugang zu einer potentiell großen Sammlung von realen Daten, die sich sicherlich auf kleinere Forschungslabors und Start-ups auswirken wird. So können Ressourcen auf die Lösung klinischer Bedürfnisse und damit verbundener technischer Probleme ausgerichtet werden, anstatt sich auf die begrenzte Versorgung mit offenen Datensätzen zu verlassen. , , FL-basierte Entwicklung impliziert auch, dass der Forscher oder KI-Entwickler nicht alle Daten, auf denen das Modell trainiert wird, untersuchen oder visualisieren kann, z.B. es nicht möglich ist, einen einzelnen Fehlerfall zu betrachten, um zu verstehen, warum das aktuelle Modell schlecht darin funktioniert. 11 12 20 Gesundheitsdienstleister Gesundheitsdienstleister in vielen Ländern sind von dem laufenden Paradigmenwechsel von volumenbasierter, d.h. kostenbasierter, zu wertbasierter Gesundheitsversorgung betroffen, die wiederum stark mit der erfolgreichen Schaffung von Präzisionsmedizin verbunden ist.Es geht nicht darum, teurere individualisierte Therapien zu fördern, sondern stattdessen bessere Ergebnisse früher durch gezieltere Behandlung zu erzielen, wodurch die Kosten gesenkt werden. Hersteller Hersteller von Software und Hardware für die Gesundheitsversorgung könnten auch von FL profitieren, da die Kombination des Lernens aus vielen Geräten und Anwendungen ohne Offenlegung von Patientenspezifischen Informationen die kontinuierliche Validierung oder Verbesserung ihrer ML-basierten Systeme erleichtern kann. Technische Überlegungen FL ist vielleicht am besten aus der Arbeit von Konečnỳ et al. bekannt. , aber verschiedene andere Definitionen wurden in der Literatur vorgeschlagen , , , Ein FL Workflow (Fig. ) kann durch verschiedene Topologien und Berechnungspläne realisiert werden (Abb. In diesem Abschnitt werden wir genauer diskutieren, was FL ist, sowie die wichtigsten Herausforderungen und technischen Überlegungen hervorheben, die bei der Anwendung von FL in der digitalen Gesundheit auftreten. 55 9 11 12 20 1 2 Definition des föderierten Lernens FL ist ein Lernparadigma, in dem mehrere Parteien kollaborativ trainieren, ohne die Notwendigkeit, Datensätze auszutauschen oder zu zentralisieren.Eine allgemeine Formulierung von FL lautet wie folgt: Lassen Sie eine globale Verlustfunktion bezeichnen, die über eine gewogene Kombination von lokale Verluste, berechnet aus privaten Daten , die bei den einzelnen Beteiligten wohnt und nie zwischen ihnen geteilt wird: K xk wo > 0 bezeichnet die jeweiligen Gewichtskoeffizienten. WK In der Praxis erhält und verfeinert jeder Teilnehmer in der Regel ein globales Konsensmodell, indem er ein paar Optimierungsrunden lokal und vor dem Teilen von Updates, entweder direkt oder über einen Parameter-Server, durchführt. ) , . The actual process for aggregating parameters depends on the network topology, as nodes might be segregated into sub-networks due to geographical or legal constraints (see Fig. Aggregationsstrategien können auf einen einzelnen Aggregationsknoten (Hub- und Sprachmodelle) oder auf mehrere Knoten ohne jegliche Zentralisierung angewiesen sein.Ein Beispiel ist Peer-to-Peer FL, wo Verbindungen zwischen allen oder einer Untergruppe der Teilnehmer existieren und Modellupdates nur zwischen direkt verbundenen Websites geteilt werden. , 1. Beachten Sie, dass Aggregationsstrategien nicht notwendigerweise Informationen über das vollständige Modell-Update erfordern; Kunden könnten wählen, nur eine Untergruppe der Modellparameter zu teilen, um die Kommunikation zu reduzieren und eine bessere Privatsphäre zu gewährleisten. oder Multi-Task-Lernalgorithmen zu produzieren, die nur einen Teil ihrer Parameter in einer föderierten Weise gelernt haben. 1 9 12 2 15 56 10 A unifying framework enabling various training schemes may disentangle compute resources (data and servers) from the Wie in Fig. Letzteres definiert die Laufbahn eines Modells über mehrere Partner hinweg, das auf spezifischen Datensätzen geschult und ausgewertet werden soll. Computerplanung 2 Herausforderungen und Überlegungen Trotz der Vorteile von FL löst es nicht alle Probleme, die dem Lernen an medizinischen Daten innewohnen.Eine erfolgreiche Modellbildung hängt immer noch von Faktoren wie Datenqualität, Bias und Standardisierung ab. Diese Probleme müssen sowohl für föderierte als auch für nicht-föderierte Lernbemühungen durch geeignete Maßnahmen gelöst werden, wie z.B. sorgfältiges Studiendesign, gemeinsame Protokolle für die Datenerfassung, strukturierte Berichterstattung und anspruchsvolle Methoden zur Entdeckung von Vorurteilen und versteckter Schichtung.Im Folgenden berühren wir die wichtigsten Aspekte von FL, die bei der Anwendung auf die digitale Gesundheit besonders relevant sind und bei der Einrichtung von FL berücksichtigt werden müssen. , , . 2 11 12 20 Heterogenität der Daten Medizinische Daten sind besonders vielfältig – nicht nur aufgrund der Vielfalt der Modalitäten, Dimensionalität und Eigenschaften im Allgemeinen, sondern auch innerhalb eines spezifischen Protokolls aufgrund von Faktoren wie Anschaffungsunterschieden, der Marke des medizinischen Geräts oder der lokalen Demographie. FL kann helfen, bestimmte Quellen von Vorurteilen durch potenziell erhöhte Vielfalt von Datenquellen anzugehen, aber eine inhomogene Datenverteilung stellt eine Herausforderung für FL-Algorithmen und -Strategien dar, da viele unabhängig und identisch verteilte (IID) Daten über die Teilnehmer annehmen. Sie scheitern unter diesen Bedingungen , , , teilweise den eigentlichen Zweck von kollaborativen Lernstrategien zu besiegen.Jüngste Ergebnisse deuten jedoch darauf hin, dass FL-Training immer noch machbar ist , auch wenn die medizinischen Daten nicht gleichmäßig über die Institutionen verteilt sind , oder ein lokales Bias enthält Forschung, die dieses Problem anspricht, umfasst zum Beispiel: Teildaten-Sharing Strategie und FL mit Domain-Adaptation Eine weitere Herausforderung ist, dass die Heterogenität der Daten zu einer Situation führen kann, in der die globale optimale Lösung für einen einzelnen lokalen Teilnehmer möglicherweise nicht optimal ist. Föderation 9 9 57 58 59 16 17 51 FedProx 57 58 18 Privacy and security Healthcare data is highly sensitive and must be protected accordingly, following appropriate confidentiality procedures. Therefore, some of the key considerations are the trade-offs, strategies and remaining risks regarding the privacy-preserving potential of FL. Datenschutz vs. Leistung: Es ist wichtig zu beachten, dass FL nicht alle potenziellen Datenschutzprobleme löst und – ähnlich wie ML-Algorithmen im Allgemeinen – immer einige Risiken mit sich bringt. Es gibt jedoch einen Kompromiss in Bezug auf die Leistung und diese Techniken können beispielsweise die Genauigkeit des endgültigen Modells beeinflussen. Darüber hinaus könnten zukünftige Techniken und/oder Nebendaten verwendet werden, um ein Modell zu kompromittieren, das zuvor als geringes Risiko angesehen wurde. 12 10 Ebene des Vertrauens: Im Großen und Ganzen können die teilnehmenden Parteien zwei Arten von FL-Kooperationen eingehen: —Für FL-Konsortien, in denen alle Parteien als vertrauenswürdig angesehen werden und durch eine durchsetzbare Kooperationsvereinbarung gebunden sind, können wir viele der schädlicheren Motivationen beseitigen, wie z. B. vorsätzliche Versuche, sensible Informationen zu extrahieren oder das Modell absichtlich zu korruptieren. Trusted —In FL-Systemen, die in größeren Maßstäben funktionieren, kann es unpraktisch sein, eine durchsetzbare Kooperationsvereinbarung zu etablieren. Einige Kunden können absichtlich versuchen, die Leistung zu degradieren, das System herunterzubringen oder Informationen von anderen Parteien zu extrahieren. Daher werden Sicherheitsstrategien erforderlich sein, um diese Risiken zu mildern, wie erweiterte Verschlüsselung von Modelllieferungen, sichere Authentifizierung aller Parteien, Rückverfolgbarkeit von Aktionen, differentielle Privatsphäre, Verifizierungssysteme, Ausführungsintegrität, Modellvertraulichkeit und Schutz vor Gegnerangriffen. Nicht vertrauenswürdig Informationsleckage: FL-Systeme vermeiden nach Definition den Austausch von Gesundheitsdaten zwischen den beteiligten Institutionen.Die geteilten Informationen können jedoch immer noch indirekt private Daten, die für lokale Schulungen verwendet werden, aufdecken, z.B. durch Modelleinversion von den Modellen aktualisiert, die Gradienten selbst or adversarial attacks , . FL is different from traditional training insofar as the training process is exposed to multiple parties, thereby increasing the risk of leakage via reverse-engineering if adversaries can observe model changes over time, observe specific model updates (i.e., a single institution’s update), or manipulate the model (e.g., induce additional memorisation by others through gradient-ascent-style attacks). Developing counter-measures, such as limiting the granularity of the updates and adding noise , und eine angemessene Differenzierung der Privatsphäre gewährleisten , kann benötigt werden und ist immer noch ein aktives Forschungsgebiet . 60 61 62 63 16 18 44 12 Rückverfolgbarkeit und Rechenschaftspflicht Wie bei allen sicherheitskritischen Anwendungen ist die Reproduzierbarkeit eines Systems für FL in der Gesundheitsversorgung wichtig. Im Gegensatz zu zentralisiertem Training erfordert FL Multiparty-Computing in Umgebungen, die eine beträchtliche Vielfalt in Bezug auf Hardware, Software und Netzwerke aufweisen. Die Rückverfolgbarkeit aller Systemvermögenswerte einschließlich Datenverlauf, Trainingskonfigurationen und Hyperparameter-Tuning während des gesamten Trainingsprozesses ist daher obligatorisch. Insbesondere in nicht vertrauenswürdigen Föderationen erfordern Rückverfolgbarkeit und Rechenschaftspflicht Prozesse Ausführungsintegrität. Nachdem der Trainingsprozess die gemeinsam vereinbarten Kriterien für die Optimierung des Modells erreicht hat, kann es auch hilfreich sein, Eine Implikation von FL ist, dass Forscher nicht in der Lage sind, Daten zu untersuchen, auf denen Modelle ausgebildet werden, um unerwartete Ergebnisse zu verstehen. Darüber hinaus müssen statistische Messungen ihrer Schulungsdaten als Teil des Modellentwicklungs-Workflows von den kooperierenden Parteien als nicht verletzende Privatsphäre genehmigt werden. Obwohl jede Website Zugang zu ihren eigenen Rohdaten hat, können Föderationen beschließen, eine Art sichere Intra-Node-Ansichtseinrichtung zur Verfügung zu stellen, um dieser Notwendigkeit gerecht zu werden, oder kann eine andere Möglichkeit zur Erhöhung der Erläuterbarkeit und Interpretation des globalen Modells bieten. 64 Systemarchitektur Im Gegensatz zu großen FL unter Verbrauchergeräten wie McMahan et al. Diese einzigartigen Eigenschaften von FL in der Gesundheitsversorgung bringen auch Herausforderungen wie die Gewährleistung der Datenintegrität bei der Kommunikation mit redundanten Knoten, das Entwerfen sicherer Verschlüsselungsmethoden, um Datenleckage zu verhindern, oder das Entwerfen geeigneter Knotenplaner, um die verteilte Berechnungsgeräte optimal zu nutzen und die Leerzeit zu reduzieren. 9 Die Verwaltung einer solchen Föderation kann auf unterschiedliche Weise verwirklicht werden. In Situationen, in denen die strengste Datenschutzmaßnahme zwischen den Parteien erforderlich ist, kann das Training über eine Art "ehrlicher Broker" -System funktionieren, in dem ein vertrauenswürdiger Dritter als Vermittler fungiert und den Zugang zu Daten erleichtert. Diese Einrichtung erfordert eine unabhängige Einheit, die das Gesamtsystem steuert, was möglicherweise nicht immer wünschenswert ist, da es zusätzliche Kosten und procedurelle Viskosität mit sich bringen könnte. Es hat jedoch den Vorteil, dass die genauen internen Mechanismen von den Kunden abstrahiert werden können, wodurch das System agiler und einfacher zu aktualisieren ist. In einem Peer-to-Peer-System interagiert jede Website direkt Schlussfolgerung ML, und insbesondere DL, hat zu einer breiten Palette von Innovationen im Bereich der digitalen Gesundheitsversorgung geführt. Da alle ML-Methoden von der Fähigkeit profitieren, Daten zuzugreifen, die der wahren globalen Verteilung entspricht, ist FL ein vielversprechender Ansatz, um leistungsfähige, genaue, sichere, robuste und unparteiische Modelle zu erhalten. Indem es mehreren Parteien ermöglicht, zusammenzuarbeiten, ohne Datensätze auszutauschen oder zu zentralisieren, befasst sich FL ordentlich mit Fragen im Zusammenhang mit dem Ausbruch sensibler medizinischer Daten. Als Folge kann es neue Forschungs- und Geschäftswege öffnen und das Potenzial hat, die Patientenversorgung weltweit zu verbessern. Jedoch hat FL bereits heute Auswirkungen Trotzdem glauben wir wirklich, dass seine möglichen Auswirkungen auf die Präzisionsmedizin und letztendlich die Verbesserung der medizinischen Versorgung sehr vielversprechend sind. 12 Berichterstattung Zusammenfassung Weitere Informationen zum Forschungsdesign finden Sie im mit diesem Artikel verbunden. Nature Research Reporting Zusammenfassung References LeCun, Y., Bengio, Y. & Hinton, G. Deep learning. , 436 (2015). Nature 521 Wang, F., Casalino, L. P. & Khullar, D. Deep learning in medicine—promise, progress, and challenges. , 293–294 (2019). JAMA Intern. Med. 179 Chartrand, G. et al. Deep learning: a primer for radiologists. , 2113–2131 (2017). Radiographics 37 De Fauw, J. et al. Clinically applicable deep learning for diagnosis and referral in retinal disease. , 1342 (2018). Nat. Med. 24 Sun, C., Shrivastava, A., Singh, S. & Gupta, A. Revisiting unreasonable effectiveness of data in deep learning era. In , 843–852 ( , 2017). Proceedings of the IEEE international conference on computer vision IEEE Van Panhuis, W. G. et al. A systematic review of barriers to data sharing in public health. , 1144 (2014). BMC Public Health 14 Rocher, L., Hendrickx, J. M. & De Montjoye, Y.-A. Estimating the success of re-identifications in incomplete datasets using generative models. , 1–9 (2019). Nat. Commun. 10 Schwarz, C. G. et al. Identification of anonymous mri research participants with face-recognition software. , 1684–1686 (2019). N. Engl. J. Med. 381 McMahan, B., Moore, E., Ramage, D., Hampson, S. & y Arcas, B. A. Communication-efficient learning of deep networks from decentralized data. In , 1273–1282. (2017). Artificial Intelligence and Statistics https://scholar.google.de/scholar?hl=de&as_sdt=0%2C5&q=Communicationefficient+learning+of+deep+networks+from+decentralized+data&btnG= Li, T., Sahu, A. K., Talwalkar, A. & Smith, V. Federated learning: Challenges, methods, and future directions. , 50–60 (IEEE, 2020). IEEE Signal Processing Magazine 37 Yang, Q., Liu, Y., Chen, T. & Tong, Y. Federated machine learning: concept and applications. , 12 (2019). ACM Trans. Intell. Syst. Technol. (TIST) 10 Kairouz, P. et al. Advances and open problems in federated learning. (2019). arXiv preprint arXiv:1912.04977 Lee, J. et al. Privacy-preserving patient similarity learning in a federated environment: development and analysis. , e20 (2018). JMIR Med. Inform. 6 Brisimi, T. S. et al. Federated learning of predictive models from federated electronic health records. , 59–67 (2018). Int. J. Med. Inform. 112 Roy, A. G., Siddiqui, S., Pölsterl, S., Navab, N. & Wachinger, C. Braintorrent: a peer-to-peer environment for decentralized federated learning. (2019). arXiv preprint arXiv:1905.06731 Li, W. et al. Privacy-preserving federated brain tumour segmentation. In , 133–141 (Springer, 2019). International Workshop on Machine Learning in Medical Imaging Sheller, M. J., Reina, G. A., Edwards, B., Martin, J. & Bakas, S. Multi-institutional deep learning modeling without sharing patient data: a feasibility study on brain tumor segmentation. In , 92–104 (Springer, 2018). International MICCAI Brainlesion Workshop Li, X. et al. Multi-site fmri analysis using privacy-preserving federated learning and domain adaptation: abide results. (2020). arXiv preprint arXiv:2001.05647 Huang, L. et al. Patient clustering improves efficiency of federated machine learning to predict mortality and hospital stay time using distributed electronic medical records. , 103291 (2019). J. Biomed. Inform. 99 Xu, J. & Wang, F. Federated learning for healthcare informatics. (2019). arXiv preprint arXiv:1911.06270 Roy, A. & Banerjee, A. Ibm’s merge healthcare acquisitio . (2015) (Accessed 10 February 2020). n https://www.reuters.com/article/us-merge-healthcare-m-a-ibm/ibm-to-buy-merge-healthcare-in-1-billion-deal-idUSKCN0QB1ML20150806 Nhs scotland’s national safe haven. (2015) (Accessed 10 February 2020). https://www.gov.scot/publications/charter-safe-havens-scotland-handling-unconsented-data-national-health-service-patient-records-support-research-statistics/pages/4/ Cuggia, M. & Combes, S. The french health data hub and the german medical informatics initiatives: Two national projects to promote data sharing in healthcare. , 195–202 (2019). Yearbook Med. Informat. 28 Health Data Research UK. (Health Data Research UK, 2020) (Accessed 10 Feb 2020). https://www.hdruk.ac.uk/ Sporns, O., Tononi, G. & Kötter, R. The human connectome: a structural description of the human brain. . , e42, (2005). PLoS Comput. Biol 1 https://doi.org/10.1371/journal.pcbi.0010042 Sudlow, C. et al. Uk biobank: an open access resource for identifying the causes of a wide range of complex diseases of middle and old age. . , e1001779. (2015). PLoS Med 12 https://doi.org/10.1371/journal.pmed.1001779 Clark, K. et al. The cancer imaging archive (tcia): maintaining and operating a public information repository. , 1045–1057 (2013). J. Digit. Imaging. 26 Wang, X. et al. Chestx-ray8: Hospital-scale chest X-ray database and benchmarks on weakly-supervised classification and localization of common thorax diseases. In , 2097–2106 ( , 2017). Proceedings of the IEEE conference on computer vision and pattern recognition IEEE Yan, K., Wang, X., Lu, L. & Summers, R. M. Deeplesion: automated mining of large-scale lesion annotations and universal lesion detection with deep learning. , 036501 (2018). J Med. Imaging. 5 Tomczak, K., Czerwińska, P. & Wiznerowicz, M. The cancer genome atlas (tcga): an immeasurable source of knowledge. , A68 (2015). Contemp. Oncol. 19 Jack Jr., C. R. et al. The alzheimer’s disease neuroimaging initiative (adni): Mri methods. , 685–691 (2008). J. Magn. Reson. Imaging 27 . (2020) (Accessed 24 July 2020). Grand Challenge-a Platform for End-to-end Development of Machine Learning Solutions in Biomedical Imaging https://grand-challenge.org/ Litjens, G. et al. 1399 h&e-stained sentinel lymph node sections of breast cancer patients: the camelyon dataset. , giy065 (2018). GigaScience 7 Menze, B. H. et al. The multimodal brain tumor image segmentation benchmark (brats). , 1993–2024 (2014). IEEE Trans. Med. Imaging 34 Bakas, S. et al. Identifying the best machine learning algorithms for brain tumor segmentation, progression assessment, and overall survival prediction in the brats challenge. (2018). arXiv preprint arXiv:1811.02629 Bakas, S. et al. Advancing the cancer genome atlas glioma MRI collections with expert segmentation labels and radiomic features. , 170117 (2017). Sci. Data 4 Simpson, A. L. et al. A large annotated medical image dataset for the development and evaluation of segmentation algorithms. (2019). arXiv preprint arXiv:1902.09063 Yeh, F.-C. et al. Quantifying differences and similarities in whole-brain white matter architecture using local connectome fingerprints. , e1005203 (2016). PLoS Comput. Biol. 12 Chang, K. et al. Distributed deep learning networks among institutions for medical imaging. , 945–954 (2018). J. Am. Med. Inform. Assoc. 25 Shokri, R., Stronati, M., Song, C. & Shmatikov, V. Membership inference attacks against machine learning models. In , 3-18 (IEEE, 2017). 2017 IEEE Symposium on Security and Privacy (SP) Sablayrolles, A., Douze, M., Ollivier, Y., Schmid, C. & Jégou, H. White-box vs black-box: Bayes optimal strategies for membership inference. In Chaudhuri, K. & Salakhutdinov, R. (eds) , 5558–5567. (PMLR, 2019). Proceedings of the 36th International Conference on Machine Learning, {ICML} 97 http://proceedings.mlr.press/v97/sablayrolles19a.html Zhang, C., Bengio, S., Hardt, M., Recht, B. & Vinyals, O. Understanding deep learning requires rethinking generalization. In , (OpenReview.net, 2017). 5th International Conference on Learning Representations, {ICLR}. https://openreview.net/forum?id=Sy8gdB9xx Carlini, N., Liu, C., Erlingsson, Ú., Kos, J. & Song, D. The secret sharer: evaluating and testing unintended memorization in neural networks. In Heninger, N. & Traynor, P. (eds) { } ({ } , 267–284. ({USENIX} Association, Santa Clara, CA, USA, 2019). 28th USENIX Security Symposium USENIX Security 19 https://www.usenix.org/conference/usenixsecurity19/presentation/carlini Abadi, M. et al. Deep learning with differential privacy. In , 308–318 (ACM, 2016). Proceedings of the 2016 ACM SIGSAC Conference on Computer and Communications Security Shokri, R. & Shmatikov, V. Privacy-preserving deep learning. In , 1310–1321 (ACM, 2015). Proceedings of the 22nd ACM SIGSAC conference on computer and communications security Langlotz, C. P. et al. A roadmap for foundational research on artificial intelligence in medical imaging: from the 2018 nih/rsna/acr/the academy workshop. , 781–791 (2019). Radiology 291 Kim, Y., Sun, J., Yu, H. & Jiang, X. Federated Tensor Factorization for Computational Phenotyping. In . 887–895. (ACM, Halifax, NS, Canada, 2017). Proceedings of the 23rd {ACM} {SIGKDD} International Conference on Knowledge Discoveryand Data Mining https://doi.org/10.1145/3097983.3098118 He, C., Annavaram, M. & Avestimehr, S. Fednas: Federated deep learning via neural architecture search. (2020). https://sites.google.com/view/cvpr20-nas/ Trustworthy federated data analytics (tfda). (2020) (Accessed 28 May 2020). https://tfda.hmsp.center/ Joint Imaging Platform (Jip). (2020) (Accessed 28 May 2020). https://jip.dktk.dkfz.de/jiphomepage/ Medical institutions collaborate to improve mammogram assessment ai. (2020) (Accessed 28 May 2020). https://blogs.nvidia.com/blog/2020/04/15/federated-learning-mammogram-assessment/ Healthchain consortium. (2020) (Accessed 28 May 2020). https://www.substra.ai/en/healthchain-project The federated tumor segmentation (fets) initiative. (2020) (Accessed 28 May 2020). https://www.fets.ai Machine learning ledger orchestration for drug discovery. (2020). Accessed 28 May 2020. https://cordis.europa.eu/project/id/831472 Konečny`, J., McMahan, H. B., Ramage, D. & Richtárik, P. Federated optimization: Distributed machine learning for on-device intelligence. (2016). arXiv preprint arXiv:1610.02527 Lalitha, A., Kilinc, O. C., Javidi, T. & Koushanfar, F. Peer-to-peer federated learning on graphs. (2019). arXiv preprint arXiv:1901.11173 Li, T., Sahu, A. K., Zaheer, M., Sanjabi, M., Talwalkar, A. & Smith, V. Federated optimization in heterogeneous networks. (2018). arXiv preprint arXiv:1812.06127 Zhao, Y. et al. Federated learning with non-iid data. (2018). arxivabs/1806.00582 Li, X., Huang, K., Yang, W., Wang, S. & Zhang, Z. On the convergence of fedavg on non-IID data. (2020). https://openreview.net/forum?id=HJxNAnVtDS Wu, B. et al. P3sgd: patient privacy preserving SGD for regularizing deep CNNs in pathological image classification. In (pp. 2099–2108) (2019). Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition Zhu, L., Liu, Z. & Han, S. Deep leakage from gradients. In Wallach, H. M. et al. (eds) , 14747–14756. (2019). Advances in Neural Information Processing Systems 32: Annual Conference on Neural Information Processing Systems http://papers.nips.cc/paper/9617-deep-leakage-from-gradients Wang, Z. et al. Beyond inferring class representatives: user-level privacy leakage from federated learning. In 2512–2520. (IEEE, Paris, France, 2019). 2019 {IEEE} Conferenceon Computer Communications, {INFOCOM} https://doi.org/10.1109/INFOCOM.2019.8737416 Hitaj, B., Ateniese, G. & Perez-Cruz, F. Deep models under the gan: information leakage from collaborative deep learning. In , CCS’17, 603–618 (Association for Computing Machinery, New York, NY, USA, 2017). Proceedings of the 2017 ACM SIGSAC Conference on Computer and Communications Security Ghorbani, A. & Zou, J. Data shapley: Equitable valuation of data for machine learning. In (pp. 2242-2251) (2019). International Conference on Machine Learning Anerkennung Diese Arbeit wurde von der UK Research and Innovation London Medical Imaging & Artificial Intelligence Centre for Value-Based Healthcare, dem Wellcome/EPSRC Centre for Medical Engineering (WT203148/Z/16/Z), dem Wellcome Flagship Programme (WT213038/Z/18/Z), dem Intramural Research Programme der National Institutes of Health (NIH) Clinical Center, dem National Cancer Institute des NIH unter Auszeichnungszahlung U01CA242871, dem National Institute of Neurological Disorders and Stroke des NIH unter Auszeichnungszahlung R01NS042645, sowie dem Helmholtz Initiative and Networking Fund (Projekt „Trustworthy Federated Data Analytics“) und dem PRIME-Programm des Deutschen Akademischen Austauschdienstes (DAAD) mit Mitteln des Bundesministeriums für Bild Dieses Papier ist unter der Lizenz CC by 4.0 Deed (Attribution 4.0 International) verfügbar. Dieses Papier ist unter der Lizenz CC by 4.0 Deed (Attribution 4.0 International) verfügbar.