Autorzy : Nicola Rieke Jonny Hancox Wenqi Li Fausto Milletarì Holger R. Roth Shadi Albarqouni Spyridon Bakas Mathieu N. Galtier Bennett A. Landman Klaus Maier-Hein Sébastien Ourselin Micah Sheller Ronald M. Summers Andrew Trask Daguang Xu Maximilian Baust M. Jorge Cardoso Autorzy : Nicole Rieke Jonny Hancox Węgry Li Fausto Milletarì Holger R. Roth jako Shadi Albarqouni Spyridon Bakas Mateusz N. Galtier reż. Bennett A. Landman K. Maier-Hein Sébastien Ourselin Michał Sheller Reż. Ronald M. Summers Andrzej Trask Daguang Xu Maksymilian Baust Prezydent Jorge Cardoso Abstract Uczenie maszynowe oparte na danych (ML) pojawiło się jako obiecujące podejście do budowania dokładnych i solidnych modeli statystycznych z danych medycznych, które są gromadzone w ogromnych objętościach przez nowoczesne systemy opieki zdrowotnej. Istniejące dane medyczne nie są w pełni wykorzystywane przez ML głównie dlatego, że znajduje się w silosach danych i obawy dotyczące prywatności ograniczają dostęp do tych danych. Jednak bez dostępu do wystarczających danych, ML zostanie uniemożliwione osiągnięcie pełnego potencjału i ostatecznie przejście od badań do praktyki klinicznej. Niniejszy artykuł rozważa kluczowe czynniki przyczyniające się do tego problemu, bada, w jaki sposób federowane uczenie się (FL) może zapewnić rozwiązanie dla przyszłości zdrowia cyfrowego i podkreśla wyzwania i Wprowadzenie Badania nad sztuczną inteligencją (AI), a w szczególności postępy w zakresie uczenia maszynowego (ML) i głębokiego uczenia się (DL) have led to disruptive innovations in radiology, pathology, genomics and other fields. Modern DL models feature millions of parameters that need to be learned from sufficiently large curated data sets in order to achieve clinical-grade accuracy, while being safe, fair, equitable and generalising well to unseen data , , , . 1 2 3 4 5 Na przykład szkolenie wykrywacza nowotworów opartego na sztucznej inteligencji wymaga dużej bazy danych obejmującej pełne spektrum możliwych anatomii, patologii i typów danych wejściowych. Nawet jeśli anonimizacja danych mogłaby ominąć te ograniczenia, obecnie dobrze wiadomo, że usuwanie metadanych, takich jak imię i nazwisko pacjenta lub data urodzenia, często nie wystarcza do zachowania prywatności. Możliwe jest na przykład odtworzenie twarzy pacjenta z danych tomografii komputerowej (CT) lub rezonansu magnetycznego (MRI). Innym powodem, dla którego udostępnianie danych nie jest systematyczne w opiece zdrowotnej, jest to, że zbieranie, kurowanie i utrzymywanie wysokiej jakości zestawu danych wymaga znacznego czasu, wysiłku i wydatków.W konsekwencji takie zestawy danych mogą mieć znaczącą wartość biznesową, co sprawia, że jest mniej prawdopodobne, że będą one swobodnie udostępniane. 6 7 8 Uczenie się związanego z federacją (FL) , , jest paradygmatem uczenia się, który stara się rozwiązać problem zarządzania danymi i prywatności poprzez szkolenie algorytmów we współpracy bez wymiany samych danych. , it recently gained traction for healthcare applications , , , , , , , FL umożliwia zdobywanie wglądu w sposób współpracujący, np. w formie modelu konsensusu, bez przenoszenia danych pacjentów poza zapory instytucji, w których mieszkają.Zamiast tego proces ML występuje lokalnie w każdej instytucji uczestniczącej i tylko cechy modelu (np. parametry, gradienty) są przenoszone, jak pokazano na rysunku. Ostatnie badania wykazały, że modele szkolone przez FL mogą osiągnąć poziomy wydajności porównywalne z tymi szkolonymi na centralnie hostowanych zestawach danych i lepsze niż modele, które widzą tylko odizolowane dane jednostronne. , . 9 10 11 12 13 14 15 16 17 18 19 20 1 16 17 Serwer agregacji FL – typowy przepływ pracy FL, w którym federacja węzłów szkoleniowych otrzymuje model globalny, ponownie przesyła częściowo przeszkolone modele do serwera centralnego w odstępach czasu w celu agregacji, a następnie kontynuuje szkolenie w modelu konsensusu, który serwer zwraca. FL peer to peer – alternatywna formuła FL, w której każdy węzeł szkoleniowy wymienia częściowo przeszkolone modele z niektórymi lub wszystkimi swoimi rówieśnikami i każdy wykonuje własną agregację. Centralizowane szkolenie – ogólny przepływ pracy szkolenia nie-FL, w którym witryny nabywające dane przekazują swoje dane do centralnego jeziora danych, z którego oni i inni mogą wyodrębniać dane do lokalnego, niezależnego szkolenia. a b c Pomyślne wdrożenie FL mogłoby zatem posiadać znaczący potencjał umożliwiający precyzyjną medycynę na dużą skalę, prowadząc do modeli, które wydają bezstronne decyzje, optymalnie odzwierciedlają fizjologię danej osoby i są wrażliwe na rzadkie choroby przy jednoczesnym poszanowaniu kwestii związanych z zarządzaniem i prywatnością. Wizualizujemy federalizowaną przyszłość dla zdrowia cyfrowego i w niniejszym dokumencie z perspektywy dzielimy się naszym konsensusem w celu zapewnienia kontekstu i szczegółów dla społeczności w odniesieniu do korzyści i wpływu FL dla zastosowań medycznych (sekcja „Medycyna oparta na danych wymaga federalizowanych wysiłków”), a także podkreślania kluczowych rozważań i wyzwań wdrażania FL dla zdrowia cyfrowego (sekcja „Rozważania techniczne”). Medycyna oparta na danych wymaga wysiłków federacyjnych ML, a zwłaszcza DL, staje się de facto podejściem do odkrywania wiedzy w wielu branżach, ale pomyślne wdrożenie aplikacji opartych na danych wymaga dużych i zróżnicowanych zbiorów danych. jednak zbiory danych medycznych są trudne do uzyskania (podsekcja „Zależność od danych”). FL rozwiązuje ten problem, umożliwiając naukę współpracującą bez scentralizowania danych (podsekcja „Obietnica związanego wysiłku”) i już znalazła drogę do cyfrowych aplikacji zdrowotnych (podsekcja „Trenujące wysiłki FL w dziedzinie zdrowia cyfrowego”). Uzależnienie od danych Podejścia oparte na danych opierają się na danych, które naprawdę reprezentują podstawowy rozkład danych problemu. Chociaż jest to dobrze znane wymaganie, najnowocześniejsze algorytmy są zazwyczaj oceniane na starannie kurowanych zestawach danych, często pochodzących tylko z kilku źródeł. To może wprowadzić uprzedzenia, w których demografia (np. płeć, wiek) lub zaburzenia równowagi technicznej (np. protokół nabycia, producent sprzętu) zniekształcają prognozy i negatywnie wpływają na dokładność dla niektórych grup lub miejsc. Potrzeba dużych baz danych do szkolenia w zakresie sztucznej inteligencji spowodowała wiele inicjatyw mających na celu łączenie danych z wielu instytucji.Dane te są często gromadzone w tzw. Data Lakes. , lub jako zasób dla wzrostu gospodarczego i postępu naukowego, np. NHS National Safe Haven w Szkocji Francuski Data Hub Zdrowia Health Data Research w Wielkiej Brytanii . 21 22 23 24 Istotne, choć mniejsze, inicjatywy obejmują Human Connectome Biobank Wielkiej Brytanii Informacje o Cancer Imaging Archive (TCIA) NIH CXR8 NIH DeepLesion Atlas genomu nowotworu (ang. Cancer Genome Atlas) Inicjatywa Neuroimaging dla Choroby Alzheimera (ADNI) Również duże wyzwania medyczne Wyzwanie Camelion , the International multimodal Brain Tumor Segmentation (BraTS) challenge , , or the Medical Segmentation Decathlon Publiczne dane medyczne są zwykle specyficzne dla zadania lub choroby i często są uwalniane z różnym stopniem ograniczeń licencyjnych, czasami ograniczając ich wykorzystanie. 25 26 27 28 29 30 31 32 33 34 35 36 37 Centralizacja lub uwalnianie danych stwarza jednak nie tylko regulacyjne, etyczne i prawne wyzwania związane z prywatnością i ochroną danych, ale także techniczne. Anonimizacja, kontrola dostępu i bezpieczne przesyłanie danych dotyczących opieki zdrowotnej to zadanie nietrwałe, a czasami niemożliwe. To samo dotyczy danych genomicznych i obrazów medycznych, które czynią je tak unikalnymi, jak odciski palców. Dlatego też, chyba że proces anonimizacji zniszczy wierność danych, prawdopodobnie czyniąc je bezużytecznymi, nie można wykluczyć ponownej identyfikacji pacjenta lub wycieku informacji. Dostęp przez bramę dla zatwierdzonych użytkowników jest często proponowany jako domniemane rozwiązanie tego problemu. 7 38 Oświadczenie o wysiłkach federacji Obietnica FL jest prosta – rozwiązać wyzwania związane z ochroną prywatności i zarządzaniem danymi, umożliwiając ML z danych niewspółlokowanych. W ustawieniu FL każdy kontroler danych nie tylko definiuje własne procesy zarządzania danymi i powiązane polityki prywatności, ale także kontroluje dostęp do danych i ma możliwość ich cofnięcia. Obejmuje to zarówno szkolenie, jak i fazę walidacji. W ten sposób FL może stworzyć nowe możliwości, np. umożliwiając dużą walidację wewnątrzinstytucjonalną lub umożliwiając nowe badania nad chorobami rzadkimi, gdzie wskaźniki incydentów są niskie, a zbiory danych w każdej instytucji są zbyt małe. Przenoszenie modelu do danych, a nie odwrotnie, ma inną dużą zaletę: wysokim Jak pokazano na fig. , przepływ pracy FL można zrealizować za pomocą różnych topologii i planów obliczeniowych.Dwa najczęstsze dla aplikacji opieki zdrowotnej są za pośrednictwem serwera agregacyjnego , , Peer to peer podejście , We wszystkich przypadkach FL oferuje pewien stopień prywatności, ponieważ uczestnicy FL nigdy nie uzyskują bezpośredniego dostępu do danych z innych instytucji i otrzymują tylko parametry modelu, które są agregowane na kilku uczestnikach.W przepływie pracy FL z serwerem agregacji uczestniczące instytucje mogą nawet pozostać nieznane sobie nawzajem. , , , W związku z tym mechanizmy takie jak różnica prywatności , lub zaproponowano uczenie się z zaszyfrowanych danych w celu dalszej poprawy prywatności w środowisku FL (zob. sekcja „Względności techniczne”). i techniki FL są rosnącym obszarem badań , . 2 16 17 18 15 39 40 41 42 43 44 45 46 12 20 FL topologie – architektura komunikacji federacji. Centralizowany: serwer agregacji koordynuje iteracje szkolenia i zbiera, agreguje i dystrybuuje modele do i z węzłów szkoleniowych (Hub & Spoke). Decentralizowany: każdy węzeł szkoleniowy jest połączony z jednym lub większą liczbą rówieśników, a agregacja odbywa się równolegle na każdym węźle. Podstawowa struktura: Podstawowa struktura: Podstawowa struktura: Podstawowa struktura: Podstawowa struktura: Podstawowa struktura: Podstawowa struktura: Podstawowa struktura: Podstawowa struktura: Podstawowa struktura: Podstawowa struktura: Podstawowa struktura: Podstawowa struktura: Podstawowa struktura ( Plany obliczeniowe FL – trajektoria modelu w kilku partnerach. Szkolenia sekwencyjne/uczenie się cyklicznego transferu. zintegrowanych serwerów, Peer to peer. a b c d e f g Obecne wysiłki FL na rzecz zdrowia cyfrowego Ponieważ FL jest ogólnym paradygmatem uczenia się, który usuwa wymóg łączenia danych dla rozwoju modelu AI, zakres zastosowań FL obejmuje cały zakres sztucznej inteligencji dla opieki zdrowotnej. W kontekście elektronicznych rejestrów zdrowia (EHR), na przykład, FL pomaga reprezentować i znaleźć klinicznie podobnych pacjentów , , a także przewidywanie hospitalizacji z powodu zdarzeń sercowych Śmiertelność i czas pobytu w ICU Zastosowanie i zalety FL zostały również wykazane w dziedzinie obrazowania medycznego, dla segmentacji całego mózgu w MRI , as well as brain tumour segmentation , Ostatnio technika ta została wykorzystana do klasyfikacji fMRI w celu znalezienia wiarygodnych biomarkerów związanych z chorobami. i sugerowane jako obiecujące podejście w kontekście COVID-19 . 13 47 14 19 15 16 17 18 48 Warto zauważyć, że wysiłki FL wymagają porozumień w celu określenia zakresu, celu i wykorzystywanych technologii, które, ponieważ są nadal nowe, mogą być trudne do określenia. Obejmują one konsorcja, które mają na celu rozwój Projekt Trustworthy Federated Data Analytics (TFDA) and the German Cancer Consortium’s Joint Imaging Platform Innym przykładem jest międzynarodowa współpraca badawcza, która wykorzystuje FL do opracowywania modeli AI do oceny mammografii. . The study showed that the FL-generated models outperformed those trained on a single institute’s data and were more generalisable, so that they still performed well on other institutes’ data. However, FL is not limited just to academic environments. akademickiego 49 50 51 By linking healthcare institutions, not restricted to research centres, FL can have direct Wpływ. trwający projekt HealthChain , na przykład, ma na celu opracowanie i wdrożenie ram FL w czterech szpitalach we Francji. To rozwiązanie generuje wspólne modele, które mogą przewidzieć odpowiedź na leczenie u pacjentów z rakiem piersi i czerniakiem. Pomaga onkologom określić najbardziej skuteczne leczenie dla każdego pacjenta z ich slajdów histologicznych lub obrazów dermoskopii. , która jest międzynarodową federacją 30 zaangażowanych instytucji opieki zdrowotnej korzystających z ram FL o otwartym źródle z graficznym interfejsem użytkownika. Celem jest poprawa wykrywania granic guza, w tym guza mózgu, guza piersi, guza wątroby i uszkodzeń kości u pacjentów z wieloma chorobami mięśniakowymi. Klinika 52 53 Kolejny obszar wpływu znajduje się w badania i tłumaczenia. FL umożliwia współpracę badawczą nawet dla konkurujących firm. W tym kontekście jedną z największych inicjatyw jest projekt Melloddy Jest to projekt mający na celu wdrożenie wielozadaniowego FL w zestawach danych 10 firm farmaceutycznych.Przez opracowanie wspólnego modelu predykcyjnego, który określa, w jaki sposób związki chemiczne wiążą się z białkami, partnerzy zamierzają zoptymalizować proces odkrywania leków bez ujawniania swoich bardzo cennych danych wewnętrznych. industrial 54 Wpływ na zainteresowane strony FL obejmuje zmianę paradygmatu od scentralizowanych jezior danych i ważne jest, aby zrozumieć jej wpływ na różne zainteresowane strony w ekosystemie FL. Klinicyści Lekarze są zwykle narażeni na podgrupę populacji w oparciu o ich lokalizację i środowisko demograficzne, co może powodować uprzedzenia dotyczące prawdopodobieństwa pewnych chorób lub ich wzajemnego powiązania. Korzystając z systemów opartych na ML, np. jako drugiego czytelnika, mogą zwiększyć swoją wiedzę fachową z wiedzy ekspertów z innych instytucji, zapewniając spójność diagnozy nieosiągalną dzisiaj. Chociaż dotyczy to systemu opartego na ML w ogóle, systemy przeszkolone w sposób federowany są potencjalnie w stanie wydać jeszcze mniej uprzedzenia i większą wrażliwość na rzadkie przypadki, ponieważ prawdopodobnie były one narażone na bardziej kompletną dystrybucję danych. pacjentów Pacjenci są zwykle traktowani lokalnie. Ustanowienie FL w skali globalnej może zapewnić wysoką jakość decyzji klinicznych niezależnie od lokalizacji leczenia. W szczególności pacjenci wymagający opieki medycznej w obszarach oddalonych mogą skorzystać z tych samych wysokiej jakości diagnoz wspomaganych ML, które są dostępne w szpitalach z dużą liczbą przypadków. To samo dotyczy rzadkich lub geograficznie rzadkich chorób, które prawdopodobnie będą miały łagodniejsze konsekwencje, jeśli można postawić szybsze i dokładniejsze diagnozy. Hospitals and practices Hospitals and practices can remain in full control and possession of their patient data with complete traceability of data access, limiting the risk of misuse by third parties. However, this will require investment in on-premise computing infrastructure or private-cloud service provision and adherence to standardised and synoptic data formats so that ML models can be trained and evaluated seamlessly. The amount of necessary compute capability depends of course on whether a site is only participating in evaluation and testing efforts or also in training efforts. Even relatively small institutions can participate and they will still benefit from collective models generated. Naukowcy i deweloperzy Naukowcy i deweloperzy sztucznej inteligencji czerpią korzyści z dostępu do potencjalnie ogromnej kolekcji danych w świecie rzeczywistym, co z pewnością wpłynie na mniejsze laboratoria badawcze i start-upy.W ten sposób zasoby można skierować na rozwiązanie potrzeb klinicznych i powiązanych problemów technicznych, a nie opierając się na ograniczonej podaży otwartych zbiorów danych. , , Rozwój oparty na FL oznacza również, że badacz lub deweloper sztucznej inteligencji nie może zbadać lub wizualizować wszystkich danych, na których model jest szkolony, np. nie można spojrzeć na indywidualny przypadek awarii, aby zrozumieć, dlaczego obecny model działa źle na nim. 11 12 20 dostawcy opieki zdrowotnej Dostawcy opieki zdrowotnej w wielu krajach są dotknięci ciągłym zmianą paradygmatu z opartej na objętości, tj. opartej na opłatach za usługi, do opieki zdrowotnej opartej na wartości, która z kolei jest silnie związana z pomyślnym ustanowieniem medycyny precyzyjnej.Nie chodzi o promowanie droższych, zindywidualizowanych terapii, ale raczej o osiąganie lepszych wyników szybciej poprzez bardziej ukierunkowane leczenie, zmniejszając tym samym koszty. producentów Producenci oprogramowania i sprzętu medycznego mogą również skorzystać z FL, ponieważ łączenie uczenia się z wielu urządzeń i aplikacji, bez ujawniania informacji specyficznych dla pacjenta, może ułatwić ciągłą walidację lub ulepszanie ich systemów opartych na ML. Technical considerations FL jest prawdopodobnie najlepiej znany z pracy Konečnỳ et al. , but various other definitions have been proposed in the literature , , , Przepływ pracy FL (Fig. ) można zrealizować za pomocą różnych topologii i planów obliczeniowych (Rys. W tej sekcji omówimy bardziej szczegółowo, czym jest FL, a także podkreślimy kluczowe wyzwania i uwagi techniczne, które pojawiają się podczas stosowania FL w zdrowiu cyfrowym. 55 9 11 12 20 1 2 Definicja federalne uczenie się FL jest paradygmatem uczenia się, w którym wiele stron trenuje wspólnie bez konieczności wymiany lub scentralizowania zbiorów danych. straty lokalne, obliczone z danych prywatnych , który zamieszkuje w poszczególnych zainteresowanych stronach i nigdy nie dzieli się między nimi: K xk gdzie > 0 oznacza odpowiednie współczynniki wagi. WK W praktyce każdy uczestnik zazwyczaj uzyskuje i udoskonala globalny model konsensusu, przeprowadzając kilka rund optymalizacji lokalnie i przed udostępnianiem aktualizacji, bezpośrednio lub za pośrednictwem serwera parametrów. ) , Faktyczny proces agregowania parametrów zależy od topologii sieci, ponieważ węzły mogą być segregowane na podsieci ze względu na ograniczenia geograficzne lub prawne (patrz Rys. Strategie agregacji mogą polegać na pojedynczym węźle agregacyjnym (modele hub i speakerów) lub na wielu węzłach bez jakiejkolwiek centralizacji. Przykładem jest FL peer-to-peer, gdzie istnieją połączenia między wszystkimi lub podzbiorem uczestników, a aktualizacje modeli są udostępniane tylko między bezpośrednio połączonymi witrynami. , Zwróć uwagę, że strategie agregacji niekoniecznie wymagają informacji o pełnej aktualizacji modelu; klienci mogą zdecydować się na udostępnienie tylko podzbioru parametrów modelu w celu zmniejszenia komunikacji, aby zapewnić lepsze zachowanie prywatności. lub produkować algorytmy uczenia się wielu zadań, które mają tylko część ich parametrów nauczonych w sposób federowany. 1 9 12 2 15 56 10 Jednolite ramy umożliwiające różne schematy szkolenia mogą oddzielić zasoby obliczeniowe (dane i serwery) od Jak pokazano na fig. Ten ostatni definiuje trajektorię modelu w kilku partnerach, który ma być przeszkolony i oceniany na podstawie określonych zbiorów danych. Komputerowy plan 2 Wyzwania i uwagi Pomimo zalet FL, nie rozwiązuje on wszystkich problemów związanych z nauką danych medycznych.Skuteczne szkolenie modelowe nadal zależy od takich czynników, jak jakość danych, uprzedzenia i standaryzacja Te kwestie muszą być rozwiązane zarówno dla stowarzyszonych, jak i niefederowanych wysiłków uczenia się poprzez odpowiednie środki, takie jak ostrożne projektowanie studiów, wspólne protokoły do pozyskiwania danych, strukturalne raportowanie i wyrafinowane metodologie do wykrywania uprzedzeń i ukrytej stratifikacji.W poniższym omówimy kluczowe aspekty FL, które są szczególnie istotne, gdy są stosowane do zdrowia cyfrowego i muszą być brane pod uwagę przy ustalaniu FL. , , . 2 11 12 20 Data heterogeneity Medical data is particularly diverse—not only because of the variety of modalities, dimensionality and characteristics in general, but even within a specific protocol due to factors such as acquisition differences, brand of the medical device or local demographics. FL may help address certain sources of bias through potentially increased diversity of data sources, but inhomogeneous data distribution poses a challenge for FL algorithms and strategies, as many are assuming independently and identically distributed (IID) data across the participants. In general, strategies such as są skłonni do porażki w tych warunkach , , , częściowo pokonując sam cel wspólnych strategii uczenia się. Ostatnie wyniki wskazują jednak, że szkolenie FL jest nadal wykonalne , even if medical data is not uniformly distributed across the institutions , lub zawiera lokalny bias Badania nad tym problemem obejmują na przykład: Strategia udostępniania części danych i FL z adaptacją domeny Innym wyzwaniem jest to, że heterogeniczność danych może prowadzić do sytuacji, w której globalne optymalne rozwiązanie może nie być optymalne dla indywidualnego uczestnika lokalnego. FedAvg 9 9 57 58 59 16 17 51 FedProx 57 58 18 Privacy and security Healthcare data is highly sensitive and must be protected accordingly, following appropriate confidentiality procedures. Therefore, some of the key considerations are the trade-offs, strategies and remaining risks regarding the privacy-preserving potential of FL. Privacy vs. performance: It is important to note that FL does not solve all potential privacy issues and—similar to ML algorithms in general—will always carry some risks. Privacy-preserving techniques for FL offer levels of protection that exceed today’s current commercially available ML models Istnieje jednak kompromis pod względem wydajności, a techniki te mogą wpływać na przykład na dokładność ostatecznego modelu. Ponadto przyszłe techniki i/lub dane pomocnicze mogą zostać wykorzystane do zagrożenia modelu, który wcześniej uznano za niskiego ryzyka. 12 10 Level of trust: Broadly speaking, participating parties can enter two types of FL collaboration: — w przypadku konsorcjum FL, w którym wszystkie strony są uważane za godne zaufania i są związane wykonalną umową o współpracy, możemy wyeliminować wiele z bardziej niekorzystnych motywacji, takich jak celowe próby wyodrębnienia poufnych informacji lub celowe zniszczenie modelu. zaufany —W systemach FL, które działają na większej skali, może być niepraktyczne ustanowienie wykonalnej umowy o współpracy. Niektórzy klienci mogą celowo próbować obniżyć wydajność, obalić system lub wyodrębnić informacje od innych stron. Dlatego strategie bezpieczeństwa będą wymagane w celu złagodzenia tych zagrożeń, takich jak zaawansowane szyfrowanie zgłoszeń modeli, bezpieczna uwierzytelnianie wszystkich stron, identyfikowalność działań, prywatność różnicowa, systemy weryfikacji, integralność wykonania, poufność modelu i zabezpieczenia przed atakami przeciwnika. Non-trusted Wyciek informacji: według definicji, systemy FL unikają udostępniania danych dotyczących opieki zdrowotnej między uczestniczącymi instytucjami. Jednak udostępniane informacje mogą nadal pośrednio narażać dane prywatne wykorzystywane do szkolenia lokalnego, np. poprzez odwrócenie modelu z aktualizacji modelu, same gradienty or adversarial attacks , . FL is different from traditional training insofar as the training process is exposed to multiple parties, thereby increasing the risk of leakage via reverse-engineering if adversaries can observe model changes over time, observe specific model updates (i.e., a single institution’s update), or manipulate the model (e.g., induce additional memorisation by others through gradient-ascent-style attacks). Developing counter-measures, such as limiting the granularity of the updates and adding noise , i zapewnienie odpowiedniej różnicy prywatności , może być potrzebne i nadal jest aktywnym obszarem badań . 60 61 62 63 16 18 44 12 Śledzenie i rozliczalność Podobnie jak w przypadku wszystkich krytycznych dla bezpieczeństwa zastosowań, odtwarzalność systemu jest ważna dla FL w opiece zdrowotnej. W przeciwieństwie do scentralizowanego szkolenia, FL wymaga wielostronnych obliczeń w środowiskach, które wykazują znaczną różnorodność pod względem sprzętu, oprogramowania i sieci. Śledzenie wszystkich zasobów systemu, w tym historii dostępu do danych, konfiguracji szkoleniowych i dostosowania hiperparametrów w całym procesie szkolenia, jest zatem obowiązkowe. W szczególności w niezaufanych federacjach, śledzenie i procesy rozliczeniowe wymagają integralności wykonywania. Po osiągnięciu przez proces szkolenia uzgodnionych wzajemnie kryteriów optymalizacji modelu, może być również przydatne do pomiaru wielkości wkładu każdego uczestnika Jednym z implikacji FL jest to, że naukowcy nie są w stanie zbadać danych, na których modele są szkolone, aby zrozumieć nieoczekiwane wyniki. Ponadto, biorąc statystyczne pomiary ich danych szkoleniowych jako część przepływu pracy na rzecz rozwoju modelu, będą musieli zostać zatwierdzeni przez współpracujące strony jako nie naruszające prywatności. 64 System architecture W przeciwieństwie do obsługi dużej skali FL wśród urządzeń konsumpcyjnych, takich jak McMahan et al. Uczestnicy instytucji opieki zdrowotnej są wyposażeni w stosunkowo potężne zasoby obliczeniowe i niezawodne sieci o wyższym przepływie, które umożliwiają szkolenie większych modeli z wieloma bardziej lokalnymi krokami szkoleniowymi i dzielenie się większą ilością informacji modelowych między węzłami.Te unikalne cechy FL w opiece zdrowotnej stanowią również wyzwania, takie jak zapewnienie integralności danych podczas komunikowania się przy użyciu nadmiernych węzłów, projektowanie bezpiecznych metod szyfrowania w celu zapobiegania wyciekom danych lub projektowanie odpowiednich harmonogramów węzłów w celu optymalnego wykorzystania rozproszonych urządzeń obliczeniowych i zmniejszenia czasu bezczynności. 9 Administracja takiej federacji może być zrealizowana na różne sposoby. W sytuacjach wymagających najbardziej rygorystycznej prywatności danych między stronami, szkolenie może działać za pośrednictwem jakiegoś rodzaju systemu „czciwego brokera”, w którym zaufana strona trzecia działa jako pośrednik i ułatwia dostęp do danych. Ta konfiguracja wymaga niezależnej jednostki kontrolującej ogólny system, co może nie zawsze być pożądane, ponieważ mogłoby to wiązać się z dodatkowymi kosztami i lepkością proceduralną. Jednak ma to zaletę, że precyzyjne wewnętrzne mechanizmy można abstrahować od klientów, co sprawia, że system jest bardziej zwinny i łatwiejszy do aktualizacji. W systemie peer-to-peer każda strona wchodzi w interakcje bezpośrednio z niektórymi Conclusion ML, a w szczególności DL, doprowadziło do szerokiej gamy innowacji w dziedzinie opieki zdrowotnej cyfrowej. Ponieważ wszystkie metody ML korzystają w dużej mierze z możliwości dostępu do danych, które zbliżają się do prawdziwego globalnego dystrybucji, FL jest obiecującym podejściem do uzyskania potężnych, dokładnych, bezpiecznych, solidnych i bezstronnych modeli. Pozwalając wielu stronom na szkolenie wspólnie bez konieczności wymiany lub scentralizowania zbiorów danych, FL czysto rozwiązuje problemy związane z ekscesem wrażliwych danych medycznych. W rezultacie może otworzyć nowe drogi badawcze i biznesowe i ma potencjał do poprawy opieki nad pacjentami na całym świecie. Jednak już dziś FL ma wpływ na prawie wszystkie zainteresowane Pomimo tego, naprawdę wierzymy, że jego potencjalny wpływ na medycynę precyzyjną i ostatecznie poprawę opieki medycznej jest bardzo obiecujący. 12 Raport podsumowujący Further information on research design is available in the link do tego artykułu. Podsumowanie badań przyrodniczych Referencje LeCun, Y., Bengio, Y. & Hinton, G. Deep learning. , 436 (2015). Nature 521 Wang, F., Casalino, L. P. & Khullar, D. Deep learning in medicine—promise, progress, and challenges. , 293–294 (2019). JAMA Intern. Med. 179 Chartrand, G. et al. Deep learning: a primer for radiologists. , 2113–2131 (2017). Radiographics 37 De Fauw, J. et al. Clinically applicable deep learning for diagnosis and referral in retinal disease. , 1342 (2018). Nat. Med. 24 Sun, C., Shrivastava, A., Singh, S. & Gupta, A. Revisiting unreasonable effectiveness of data in deep learning era. In , 843–852 ( , 2017). Proceedings of the IEEE international conference on computer vision IEEE Van Panhuis, W. G. et al. A systematic review of barriers to data sharing in public health. , 1144 (2014). BMC Public Health 14 Rocher, L., Hendrickx, J. M. & De Montjoye, Y.-A. Estimating the success of re-identifications in incomplete datasets using generative models. , 1–9 (2019). Nat. Commun. 10 Schwarz, C. G. et al. Identification of anonymous mri research participants with face-recognition software. , 1684–1686 (2019). N. Engl. J. Med. 381 McMahan, B., Moore, E., Ramage, D., Hampson, S. & y Arcas, B. A. Communication-efficient learning of deep networks from decentralized data. In , 1273–1282. (2017). Artificial Intelligence and Statistics https://scholar.google.de/scholar?hl=de&as_sdt=0%2C5&q=Communicationefficient+learning+of+deep+networks+from+decentralized+data&btnG= Li, T., Sahu, A. K., Talwalkar, A. & Smith, V. Federated learning: Challenges, methods, and future directions. , 50–60 (IEEE, 2020). IEEE Signal Processing Magazine 37 Yang, Q., Liu, Y., Chen, T. & Tong, Y. Federated machine learning: concept and applications. , 12 (2019). ACM Trans. Intell. Syst. Technol. (TIST) 10 Kairouz, P. et al. Advances and open problems in federated learning. (2019). arXiv preprint arXiv:1912.04977 Lee, J. et al. Privacy-preserving patient similarity learning in a federated environment: development and analysis. , e20 (2018). JMIR Med. Inform. 6 Brisimi, T. S. et al. Federated learning of predictive models from federated electronic health records. , 59–67 (2018). Int. J. Med. Inform. 112 Roy, A. G., Siddiqui, S., Pölsterl, S., Navab, N. & Wachinger, C. Braintorrent: a peer-to-peer environment for decentralized federated learning. (2019). arXiv preprint arXiv:1905.06731 Li, W. et al. Privacy-preserving federated brain tumour segmentation. In , 133–141 (Springer, 2019). International Workshop on Machine Learning in Medical Imaging Sheller, M. J., Reina, G. A., Edwards, B., Martin, J. & Bakas, S. Multi-institutional deep learning modeling without sharing patient data: a feasibility study on brain tumor segmentation. In , 92–104 (Springer, 2018). International MICCAI Brainlesion Workshop Li, X. et al. Multi-site fmri analysis using privacy-preserving federated learning and domain adaptation: abide results. (2020). arXiv preprint arXiv:2001.05647 Huang, L. et al. Patient clustering improves efficiency of federated machine learning to predict mortality and hospital stay time using distributed electronic medical records. , 103291 (2019). J. Biomed. Inform. 99 Xu, J. & Wang, F. Federated learning for healthcare informatics. (2019). arXiv preprint arXiv:1911.06270 Roy, A. & Banerjee, A. Ibm’s merge healthcare acquisitio . (2015) (Accessed 10 February 2020). n https://www.reuters.com/article/us-merge-healthcare-m-a-ibm/ibm-to-buy-merge-healthcare-in-1-billion-deal-idUSKCN0QB1ML20150806 Nhs scotland’s national safe haven. (2015) (Accessed 10 February 2020). https://www.gov.scot/publications/charter-safe-havens-scotland-handling-unconsented-data-national-health-service-patient-records-support-research-statistics/pages/4/ Cuggia, M. & Combes, S. The french health data hub and the german medical informatics initiatives: Two national projects to promote data sharing in healthcare. , 195–202 (2019). Yearbook Med. Informat. 28 Health Data Research UK. (Health Data Research UK, 2020) (Accessed 10 Feb 2020). https://www.hdruk.ac.uk/ Sporns, O., Tononi, G. & Kötter, R. The human connectome: a structural description of the human brain. . , e42, (2005). PLoS Comput. Biol 1 https://doi.org/10.1371/journal.pcbi.0010042 Sudlow, C. et al. Uk biobank: an open access resource for identifying the causes of a wide range of complex diseases of middle and old age. . , e1001779. (2015). PLoS Med 12 https://doi.org/10.1371/journal.pmed.1001779 Clark, K. et al. The cancer imaging archive (tcia): maintaining and operating a public information repository. , 1045–1057 (2013). J. Digit. Imaging. 26 Wang, X. et al. Chestx-ray8: Hospital-scale chest X-ray database and benchmarks on weakly-supervised classification and localization of common thorax diseases. In , 2097–2106 ( , 2017). Proceedings of the IEEE conference on computer vision and pattern recognition IEEE Yan, K., Wang, X., Lu, L. & Summers, R. M. Deeplesion: automated mining of large-scale lesion annotations and universal lesion detection with deep learning. , 036501 (2018). J Med. Imaging. 5 Tomczak, K., Czerwińska, P. & Wiznerowicz, M. The cancer genome atlas (tcga): an immeasurable source of knowledge. , A68 (2015). Contemp. Oncol. 19 Jack Jr., C. R. et al. The alzheimer’s disease neuroimaging initiative (adni): Mri methods. , 685–691 (2008). J. Magn. Reson. Imaging 27 . (2020) (Accessed 24 July 2020). Grand Challenge-a Platform for End-to-end Development of Machine Learning Solutions in Biomedical Imaging https://grand-challenge.org/ Litjens, G. et al. 1399 h&e-stained sentinel lymph node sections of breast cancer patients: the camelyon dataset. , giy065 (2018). GigaScience 7 Menze, B. H. et al. The multimodal brain tumor image segmentation benchmark (brats). , 1993–2024 (2014). IEEE Trans. Med. Imaging 34 Bakas, S. et al. Identifying the best machine learning algorithms for brain tumor segmentation, progression assessment, and overall survival prediction in the brats challenge. (2018). arXiv preprint arXiv:1811.02629 Bakas, S. et al. Advancing the cancer genome atlas glioma MRI collections with expert segmentation labels and radiomic features. , 170117 (2017). Sci. Data 4 Simpson, A. L. et al. A large annotated medical image dataset for the development and evaluation of segmentation algorithms. (2019). arXiv preprint arXiv:1902.09063 Yeh, F.-C. et al. Quantifying differences and similarities in whole-brain white matter architecture using local connectome fingerprints. , e1005203 (2016). PLoS Comput. Biol. 12 Chang, K. et al. Distributed deep learning networks among institutions for medical imaging. , 945–954 (2018). J. Am. Med. Inform. Assoc. 25 Shokri, R., Stronati, M., Song, C. & Shmatikov, V. Membership inference attacks against machine learning models. In , 3-18 (IEEE, 2017). 2017 IEEE Symposium on Security and Privacy (SP) Sablayrolles, A., Douze, M., Ollivier, Y., Schmid, C. & Jégou, H. White-box vs black-box: Bayes optimal strategies for membership inference. In Chaudhuri, K. & Salakhutdinov, R. (eds) , 5558–5567. (PMLR, 2019). Proceedings of the 36th International Conference on Machine Learning, {ICML} 97 http://proceedings.mlr.press/v97/sablayrolles19a.html Zhang, C., Bengio, S., Hardt, M., Recht, B. & Vinyals, O. Understanding deep learning requires rethinking generalization. In , (OpenReview.net, 2017). 5th International Conference on Learning Representations, {ICLR}. https://openreview.net/forum?id=Sy8gdB9xx Carlini, N., Liu, C., Erlingsson, Ú., Kos, J. & Song, D. The secret sharer: evaluating and testing unintended memorization in neural networks. In Heninger, N. & Traynor, P. (eds) { } ({ } , 267–284. ({USENIX} Association, Santa Clara, CA, USA, 2019). 28th USENIX Security Symposium USENIX Security 19 https://www.usenix.org/conference/usenixsecurity19/presentation/carlini Abadi, M. et al. Deep learning with differential privacy. In , 308–318 (ACM, 2016). Proceedings of the 2016 ACM SIGSAC Conference on Computer and Communications Security Shokri, R. & Shmatikov, V. Privacy-preserving deep learning. In , 1310–1321 (ACM, 2015). Proceedings of the 22nd ACM SIGSAC conference on computer and communications security Langlotz, C. P. et al. A roadmap for foundational research on artificial intelligence in medical imaging: from the 2018 nih/rsna/acr/the academy workshop. , 781–791 (2019). Radiology 291 Kim, Y., Sun, J., Yu, H. & Jiang, X. Federated Tensor Factorization for Computational Phenotyping. In . 887–895. (ACM, Halifax, NS, Canada, 2017). Proceedings of the 23rd {ACM} {SIGKDD} International Conference on Knowledge Discoveryand Data Mining https://doi.org/10.1145/3097983.3098118 He, C., Annavaram, M. & Avestimehr, S. Fednas: Federated deep learning via neural architecture search. (2020). https://sites.google.com/view/cvpr20-nas/ Trustworthy federated data analytics (tfda). (2020) (Accessed 28 May 2020). https://tfda.hmsp.center/ Joint Imaging Platform (Jip). (2020) (Accessed 28 May 2020). https://jip.dktk.dkfz.de/jiphomepage/ Medical institutions collaborate to improve mammogram assessment ai. (2020) (Accessed 28 May 2020). https://blogs.nvidia.com/blog/2020/04/15/federated-learning-mammogram-assessment/ Healthchain consortium. (2020) (Accessed 28 May 2020). https://www.substra.ai/en/healthchain-project The federated tumor segmentation (fets) initiative. (2020) (Accessed 28 May 2020). https://www.fets.ai Machine learning ledger orchestration for drug discovery. (2020). Accessed 28 May 2020. https://cordis.europa.eu/project/id/831472 Konečny`, J., McMahan, H. B., Ramage, D. & Richtárik, P. Federated optimization: Distributed machine learning for on-device intelligence. (2016). arXiv preprint arXiv:1610.02527 Lalitha, A., Kilinc, O. C., Javidi, T. & Koushanfar, F. Peer-to-peer federated learning on graphs. (2019). arXiv preprint arXiv:1901.11173 Li, T., Sahu, A. K., Zaheer, M., Sanjabi, M., Talwalkar, A. & Smith, V. Federated optimization in heterogeneous networks. (2018). arXiv preprint arXiv:1812.06127 Zhao, Y. et al. Federated learning with non-iid data. (2018). arxivabs/1806.00582 Li, X., Huang, K., Yang, W., Wang, S. & Zhang, Z. On the convergence of fedavg on non-IID data. (2020). https://openreview.net/forum?id=HJxNAnVtDS Wu, B. et al. P3sgd: patient privacy preserving SGD for regularizing deep CNNs in pathological image classification. In (pp. 2099–2108) (2019). Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition Zhu, L., Liu, Z. & Han, S. Deep leakage from gradients. In Wallach, H. M. et al. (eds) , 14747–14756. (2019). Advances in Neural Information Processing Systems 32: Annual Conference on Neural Information Processing Systems http://papers.nips.cc/paper/9617-deep-leakage-from-gradients Wang, Z. et al. Beyond inferring class representatives: user-level privacy leakage from federated learning. In 2512–2520. (IEEE, Paris, France, 2019). 2019 {IEEE} Conferenceon Computer Communications, {INFOCOM} https://doi.org/10.1109/INFOCOM.2019.8737416 Hitaj, B., Ateniese, G. & Perez-Cruz, F. Deep models under the gan: information leakage from collaborative deep learning. In , CCS’17, 603–618 (Association for Computing Machinery, New York, NY, USA, 2017). Proceedings of the 2017 ACM SIGSAC Conference on Computer and Communications Security Ghorbani, A. & Zou, J. Data shapley: Equitable valuation of data for machine learning. In (pp. 2242-2251) (2019). International Conference on Machine Learning Uznania Prace te były wspierane przez UK Research and Innovation London Medical Imaging & Artificial Intelligence Centre for Value-Based Healthcare, przez Wellcome/EPSRC Centre for Medical Engineering (WT203148/Z/16/Z), przez Wellcome Flagship Programme (WT213038/Z/18/Z), przez Intramural Research Programme Narodowych Instytutów Zdrowia (NIH) Clinical Center, przez National Cancer Institute of the NIH under award number U01CA242871, przez National Institute of Neurological Disorders and Stroke of the NIH under award number R01NS042645, a także przez Helmholtz Initiative and Networking Fund (projekt „Trustworthy Federated Data Analytics”) i program PRIME niemieckiej Akademickiej Służby Wymiany (DAAD) z funduszami niemieckiego Federal Niniejszy artykuł jest dostępny w naturze na podstawie licencji CC by 4.0 Deed (Attribution 4.0 International). Ten dokument jest under CC by 4.0 Deed (Attribution 4.0 International) license. Dostępne w naturze