Autori : Никола Рике Џони Ханкокс Винчи Ли Fausto Milletarì Холгер Р. Рот Схади Албаркуни Спиридон Бакас Матије Н. Галије Беннет А. Ландман Клаус Мајер-Хејн Себастијан Оурселин Мика Шелер Роналд М. Самерс Андреј Траск Дагуанг Xu Максимилијан Бауст Хорхе Кардосо Autori : Никола Рике Џони Ханкокс Винчи Ли Фаусто Милетари Холгер Р. Рот Схади Албаркуни Спиридон Бакас Матије Н. Галије Беннет А. Ландман Клаус Мајер-Хејн Себастијан Оурселин Мика Шелер Роналд М. Самерс Андреј Траск Дагуанг Xu Максимилијан Бауст Хорхе Кардосо апстракт Постојећи медицински подаци нису у потпуности искоришћени од стране МЛ првенствено зато што се налазе у силосима података и бриге о приватности ограничавају приступ овим подацима. Међутим, без приступа довољним подацима, МЛ ће бити спречен да достигне свој пуни потенцијал и, на крају, да направи прелазак од истраживања до клиничке праксе. Овај документ разматра кључне факторе који доприносе овом питању, истражује како федеративно учење (ФЛ) може пружити решење за будућност дигиталног здравља и истиче изазове и разматрања која се морају решити. Увод Истраживање вештачке интелигенције (АИ), а посебно напредак у машинском учењу (МЛ) и дубоком учењу (ДЛ) Модерни ДЛ модели садрже милионе параметара који се морају научити из довољно великих курираних скупова података како би се постигла клиничка тачност, док су сигурни, фер, фер и генерализују добро до невидљивих података , , , . 1 2 3 4 5 На пример, обука детектора тумора заснованог на АИ захтева велику базу података која обухвата цео спектар могућих анатомија, патологија и типова улазних података. Чак и ако анонимизација података може заобићи ова ограничења, сада је добро схватано да уклањање метаподатака као што су име пацијента или датум рођења често није довољно за очување приватности. На пример, могуће је реконструисати лице пацијента из података рачунарске томографије (ЦТ) или магнетне резонанце (МРИ) Drugi razlog zašto deljenje podataka nije sistematsko u zdravstvenoj zaštiti je to što prikupljanje, korišćenje i održavanje visokokvalitetnog skupa podataka zahteva znatno vreme, napor i troškove. Posle toga, takvi skupi podataka mogu imati značajnu poslovnu vrednost, čime je manje verovatno da će biti slobodno deljeni. 6 7 8 Федерално учење (ФЛ) , , је парадигма учења која настоји да реши проблем управљања подацима и приватности обуком алгоритма у сарадњи без размене самих података. , недавно је стекао привлачност за здравствене апликације , , , , , , , ФЛ омогућава колективно стицање увида, на пример, у облику модела консензуса, без померања података пацијената изван заштитних зидова институција у којима они живе. уместо тога, процес МЛ се јавља локално у свакој институцији која учествује и преносе се само карактеристике модела (нпр. параметри, градијенти) као што је приказано на слици. Недавна истраживања су показала да модели обучени од стране ФЛ-а могу постићи нивое перформанси упоредиве са онима обученим на централно хостованим скуповима података и супериорнији од модела који виде само изоловане појединачне институционалне податке , . 9 10 11 12 13 14 15 16 17 18 19 20 1 16 17 ФЛ агрегациони сервер – типичан ФЛ радни ток у којем федерација тренинг чворова прима глобални модел, поновно подноси своје делимично обучене моделе централном серверу интермитентно за агрегацију, а затим наставља обуку о консензусном моделу који сервер враћа. FL peer to peer – алтернативна формулација ФЛ у којој сваки тренинг чвор размењује своје делимично обучене моделе са неким или свим својим вршњацима и сваки врши своју агрегацију. Centralizovano obuka – opšte ne-FL obuka tok posla u kojem sajtovi za dobijanje podataka doniraju svoje podatke u centralnom jezeru podataka iz koje oni i drugi mogu da izvuku podatke za lokalno, nezavisno obuku. a b c Успешна имплементација ФЛ-а може имати значајан потенцијал за омогућавање прецизне медицине на великој скали, што ће довести до модела који доносе непристрасне одлуке, оптимално одражавају физиологију појединца, и осетљиви су на ретке болести док поштују бриге о управљању и приватности. Ми предвиђамо федералну будућност за дигитално здравље и са овим перспективним документом, делимо наш консензус са циљем пружања контекста и детаља за заједницу у вези са користима и утицајем ФЛ за медицинске апликације (секција "Дата-диригирана медицина захтева федералне напоре"), као и истицање кључних разматрања и изазова имплементације ФЛ за дигитално здравље (секција "Техничке разматрања"). Медицина заснована на подацима захтева савезни напор ML, a posebno DL, postaje de facto pristup otkrivanju znanja u mnogim industrijama, ali uspešna implementacija aplikacija zasnovanih na podacima zahteva velike i raznovrsne skupove podataka. međutim, medicinski skupovi podataka su teški za dobijanje (pododdeljak „Ovisnost o podacima“). FL rešava ovaj problem omogućavanjem kolaborativnog učenja bez centralizovanja podataka (pododdeljak „Obećanje federalizovanih napora“) i već je našao svoj put digitalnim zdravstvenim aplikacijama (pododdeljak „Trenutni napori FL za digitalno zdravlje“). Ovisnost o podacima Поступци засновани на подацима ослањају се на податке који заиста представљају основну дистрибуцију података проблема. Иако је ово добро познат услов, најсавременији алгоритми се обично процењују на пажљиво куратираним скуповима података, често потичући од само неколико извора. Ово може увести предрасуде где демографија (нпр. пол, старост) или техничка неравнотежа (нпр. протокол набавке, произвођач опреме) искривљују предвиђања и негативно утичу на тачност за одређене групе или локације. Међутим, да би се ухватили суптилни односи између образаца болести, социо-економских и генетских фактора, као и сложених и ретких случајева, кључно је из Potreba za velikim bazama podataka za obuku o veštačkoj inteligenciji izazvala je mnoge inicijative koje žele da ujedine podatke iz više institucija.Ovi podaci se često skupljaju u takozvane Data Lakes.Ovi su izgrađeni sa ciljem da se iskoristi komercijalna vrednost podataka, npr. IBM-ova akvizicija Merge Healthcare. , или као ресурс за економски раст и научни напредак, на пример, НХС Шкотска Национална сигурна лука Француски здравствени подаци Хаб Истраживање здравствених података Велика Британија . 21 22 23 24 Суштинске, мада мање, иницијативе укључују људски конектом , the UK Biobank , the Cancer Imaging Archive (TCIA) NIH CXR8 NIH DeepLesion , the Cancer Genome Atlas (TCGA) Алцхајмерова болест Неуроимагинг Иницијатива (АДНИ) kao i veliki medicinski izazovi Као што је изазов Цамелион Међународни мултимодални изазов за сегментацију тумора мозга (БРАТС) , , Медицинска сегментација Decathlon Јавни медицински подаци су обично специфични за задатке или болести и често се ослобађају са различитим степенима ограничења лиценце, понекад ограничавајући његову експлоатацију. 25 26 27 28 29 30 31 32 33 34 35 36 37 Centralizovanje ili objavljivanje podataka, međutim, predstavlja ne samo regulatorne, etičke i pravne izazove, vezane za privatnost i zaštitu podataka, već i tehničke. Anonimizovanje, kontrola pristupa i bezbedan prenos podataka o zdravstvenoj zaštiti nije trivijalan, a ponekad i nemoguć zadatak. Исто важи и за геномске податке и медицинске слике које их чине јединственим као отисак прста. Стога, осим ако процес анонимизације не уништи верност података, вероватно чинећи их бескорисним, поновно идентификовање пацијента или цурење информација не може се искључити. Вратат приступ за одобрене кориснике се често предлаже као претпостављено решење овог проблема. 7 38 Обећање федералних напора Обећање ФЛ-а је једноставно – да се бави изазовима у вези са приватношћу и управљањем подацима омогућавајући МЛ из не-ко-лоцираних података. У ФЛ-у, сваки контролор података не само да дефинише своје процесе управљања подацима и повезане политике приватности, већ и контролише приступ подацима и има могућност да их поништи. Ово укључује и обуку и фазу валидације. На овај начин, ФЛ би могао да створи нове могућности, на пример, омогућавајући велику, институционалну валидацију или омогућавајући нова истраживања о ретким болестима, где су стопе инцидента ниске, а скупови података у свакој појединачној институцији су премали. Пребацивање модела Као што је приказано у Фиг. , ФЛ радни ток се може реализовати са различитим топологијама и рачунарским плановима.Две најчешће за здравствене апликације су преко сервера за агрегацију , , i peer to peer približava , У свим случајевима, ФЛ имплицитно нуди одређени степен приватности, јер учесници ФЛ никада не приступају директно подацима из других институција и примају само параметре модела који су агрегирани преко неколико учесника.У ФЛ току рада са сервером агрегације, учесничке институције могу чак остати непознате једни другима. , , , Стога, механизми као што је диференцијална приватност , ili su predložena učenja iz šifrovanih podataka kako bi se dodatno poboljšala privatnost u FL okruženju (videti odeljak „Tehnička razmatranja“). и ФЛ технике су растуће поље истраживања , . 2 16 17 18 15 39 40 41 42 43 44 45 46 12 20 ФЛ топологије — комуникацијска архитектура федерације. Centralizovan: agregatni server koordinira iteracije obuke i prikuplja, agregira i distribuira modele u i iz nodova obuke (Hub & Spoke). Децентрализовано: сваки тренинг чвор је повезан са једним или више вршњака и агрегација се одвија на сваком чвору паралелно. Хијерархијски: федеративне мреже могу се састојати од неколико под-федерација, које се могу изградити из мешавине Peer-to-Peer и Aggregation Server федерација ( ФЛ рачунарски планови — трајекторија модела преко неколико партнера. Секунентно образовање / циклично трансферно учење. Aggregation server, Peer je peer. a b c d e f g Тренутни напори ФЛ за дигитално здравље Пошто је ФЛ општа парадигма учења која уклања захтев за удруживање података за развој модела ИИ-а, опсег апликација ФЛ-а покрива цео АИ за здравствену заштиту. пружајући прилику да се ухвати већа варијабилност података и анализира пацијенти у различитим демографским групама, ФЛ може омогућити поремећајне иновације за будућност, али се такође користи сада. У контексту електронске здравствене евиденције (ЕХР), на пример, ФЛ помаже у представљању и проналажењу клинички сличних пацијената , , као и предвиђање хоспитализација због срчаних догађаја , Смртност и ИЦУ време боравка Применљивост и предности ФЛ-а такође су демонстриране у области медицинске слике, за целу сегментацију мозга у МРИ-у. , као и сегментација тумора мозга , Недавно је техника коришћена за фМРИ класификацију да би се пронашли поуздани биомаркери везани за болести. и предложио као обећавајући приступ у контексту ЦОВИД-19 . 13 47 14 19 15 16 17 18 48 Вреди напоменути да напори ФЛ-а захтевају споразуме како би се дефинисали опсег, циљ и технологије које се користе, а које, пошто су још увек нове, могу бити тешке за одређивање.У том контексту, данашње велике иницијативе заиста су пионири сутрашњих стандарда за сигурну, фер и иновативну сарадњу у здравственим апликацијама. Ово укључује конзорцијуме који имају за циљ да напредују истраживања, као што је пројекат Trustworthy Federated Data Analytics (TFDA) Заједничка платформа за сликање Немачког конзорцијума за рак , који омогућавају децентрализована истраживања широм немачких истраживачких институција за медицинску сликање. Други пример је међународна истраживачка сарадња која користи ФЛ за развој модела АИ за процену мамограма Студија је показала да су модели генерисани ФЛ-ом превазишли оне обучене на подацима једног института и били су генерализованији, тако да су и даље добро функционисали на подацима других института. академски 49 50 51 Повезивањем здравствених установа, које нису ограничене на истраживачке центре, ФЛ може имати директну impact.The ongoing HealthChain project Пројекат здравственог ланца , на пример, има за циљ да развије и распореди ФЛ оквир у четири болнице у Француској. Ово решење генерише заједничке моделе који могу предвидети одговор на лечење за пацијенте са раком дојке и меланомом. Помаже онколозима да утврде најефикаснији третман за сваког пацијента из својих хистолошких слајдова или дермоскопијских слика. , која је међународна федерација од 30 посвећених здравствених установа које користе ФЛ оквир отвореног кода са графичким корисничким интерфејсом. Циљ је побољшати детекцију граница тумора, укључујући глиом мозга, туморе дојке, туморе јетре и лезије костију од вишеструких пацијената са мијеломом. Клинички 52 53 Друга област утицаја је унутар истраживање и превод. ФЛ омогућава заједничко истраживање чак и за конкурентне компаније.У том контексту, једна од највећих иницијатива је пројекат Меллодди То је пројекат који има за циљ распоређивање мулти-таск ФЛ-а преко података од 10 фармацеутских компанија.Обуком заједничког предвиђачког модела, који закључује како се хемијска једињења везују за протеине, партнери намеравају да оптимизују процес откривања лекова без откривања својих високо вредних унутрашњих података. Индустријски 54 Impact on stakeholders FL obuhvata promenu paradigme od centralizovanih jezera podataka i važno je razumeti njen uticaj na različite aktere u FL ekosistemu. Клиничари Клиничари су обично изложени подгрупи становништва на основу њихове локације и демографског окружења, што може изазвати пристрасне претпоставке о вероватноћи одређених болести или њиховој међусобној повезаности. Коришћењем система заснованих на МЛ-у, на пример, као другог читаоца, они могу повећати своју стручност са стручним знањем из других институција, осигуравајући конзистентност дијагнозе која данас није постигнута. Док се то односи на систем заснован на МЛ-у уопште, системи обучени на федеративни начин потенцијално могу донети још мање пристрасне одлуке и већу осетљивост на ретке случајеве јер су вероватно били изложени потпунијој дистрибуцији података. Пацијенти Пацијенти се обично третирају локално. Успостављање ФЛ на глобалном нивоу могло би осигурати висок квалитет клиничких одлука без обзира на локацију лечења. Конкретно, пацијенти којима је потребна медицинска помоћ у удаљеним подручјима могли би имати користи од истих висококвалитетних МЛ-помоћних дијагноза које су доступне у болницама са великим бројем случајева. Исто важи и за ретке, или географски неуобичајене, болести, које ће вероватно имати блаже последице ако се могу направити брже и прецизније дијагнозе. Болнице и праксе Hospitals and practices can remain in full control and possession of their patient data with complete traceability of data access, limiting the risk of misuse by third parties. However, this will require investment in on-premise computing infrastructure or private-cloud service provision and adherence to standardised and synoptic data formats so that ML models can be trained and evaluated seamlessly. The amount of necessary compute capability depends of course on whether a site is only participating in evaluation and testing efforts or also in training efforts. Even relatively small institutions can participate and they will still benefit from collective models generated. Researchers and AI developers Истраживачи и програмери вештачке интелигенције имају користи од приступа потенцијално великом збирку података из стварног света, што ће сигурно утицати на мање истраживачке лабораторије и старт-уп.Тако, ресурси могу бити усмерени на рјешавање клиничких потреба и повезаних техничких проблема, а не ослањајући се на ограничено снабдевање отворених података. , , Развој заснован на ФЛ-у такође подразумева да истраживач или програмер АИ не може истражити или визуализирати све податке на којима се тренира модел, на пример, није могуће погледати појединачни случај неуспјеха да би се разумело зашто тренутни модел лоше функционише на њему. 11 12 20 Healthcare providers Здравствени радници у многим земљама су погођени текућом парадигмом промјене од базиране на запремини, односно накнаде за услуге, на здравствену заштиту засновану на вредности, која је, заузврат, снажно повезана са успјешним успостављањем прецизне медицине.То није о промовисању скупљих индивидуализованих терапија, већ о постизању бољих резултата раније кроз фокусиранији третман, чиме се смањују трошкови. Произвођачи Произвођачи здравственог софтвера и хардвера такође би могли имати користи од ФЛ-а, јер комбиновање учења из многих уређаја и апликација, без откривања информација специфичних за пацијента, може олакшати континуирану валидацију или побољшање њихових система заснованих на МЛ-у. Техничка разматрања ФЛ је можда најпознатији из рада Конечне и др. , али различите друге дефиниције су предложене у литератури , , , . A FL workflow (Fig. ) могу се реализовати преко различитих топологија и рачунарских планова (Слика. У овом одељку ћемо детаљније размотрити шта је ФЛ, као и истицање кључних изазова и техничких разматрања која се јављају приликом примене ФЛ у дигиталном здрављу. 55 9 11 12 20 1 2 Дефиниција федералног учења ФЛ је парадигма учења у којој више странака тренирају заједнички без потребе за размјеном или централизацијом скупова података.Општа формулација ФЛ-а гласи следеће: Нека означи глобалну функцију губитка добијену преко тежене комбинације локални губици, израчунати из приватних података , која живи код појединачних укључених страна и никада није подељена међу њима: K xk where > 0 означава одговарајуће коефицијенте тежине. wk У пракси, сваки учесник обично добија и усавршава модел глобалног консензуса спровођењем неколико рунди оптимизације локално и пре дељења ажурирања, било директно или преко сервера параметара. ) , Стварни процес агрегирања параметара зависи од мрежне топологије, јер чворови могу бити сегрегирани у под-мреже због географских или правних ограничења (види Фиг. Стратегије агрегације могу се ослањати на један агрегациони чвор (модели хауба и говорника), или на више чворова без икакве централизације.Пример је Пјер-то-пеер ФЛ, где постоје везе између свих или подсети учесника и ажурирања модела се деле само између директно повезаних локација. , , док је пример централизоване ФЛ агрегације дат у Алгоритму 1. Напомена: стратегије агрегације не захтевају нужно информације о пуном ажурирању модела; клијенти могу изабрати да деле само подскуп параметара модела ради смањења комуникације, осигурања бољег очувања приватности или да произведе алгоритме за учење са више задатака који имају само део њихових параметара научених на федератиран начин. 1 9 12 2 15 56 10 Јединствени оквир који омогућава различите шеме обуке може одвојити рачунарске ресурсе (подаци и сервери) од Као што је приказано на Фиг. Ово друго дефинише трајекторију модела преко неколико партнера, који ће бити обучени и процењени на специфичним скуповима података. Рачунарски план 2 izazovi i razmatranja Упркос предностима ФЛ-а, он не решава све проблеме који су инхерентни учењу о медицинским подацима.Успешна обука за моделирање и даље зависи од фактора као што су квалитет података, предрасуде и стандардизација Ова питања морају бити решена и за савезне и за не-федералне напоре учења кроз одговарајуће мере, као што су пажљив дизајн студија, заједнички протоколи за прикупљање података, структурирано извјештавање и софистициране методологије за откривање пристрасности и скривене стратификације.У наставку, додирујемо кључне аспекте ФЛ-а који су посебно релевантни када се примењују на дигитално здравље и морају се узети у обзир приликом успостављања ФЛ-а. , , . 2 11 12 20 Хетерогеност података Медицински подаци су посебно разноврсни - не само због разноликости модалитета, димензионалности и карактеристика уопште, већ чак и унутар специфичног протокола због фактора као што су разлике у стицању, бренд медицинског уређаја или локална демографија. ФЛ може помоћи у рјешавању одређених извора предрасуда кроз потенцијално повећану разноликост извора података, али нехомогена дистрибуција података представља изазов за ФЛ алгоритме и стратегије, јер многи претпостављају независно и идентично дистрибуиране (ИИД) податке преко учесника. are prone to fail under these conditions , , , делимично поражавајући саму сврху стратегија заједничког учења.Недавни резултати, међутим, указују на то да је ФЛ обука и даље изводљива , even if medical data is not uniformly distributed across the institutions , или укључује локални биас . Research addressing this problem includes, for example, Strategija deljenja podataka и ФЛ са домен-адаптацијом . Another challenge is that data heterogeneity may lead to a situation in which the global optimal solution may not be optimal for an individual local participant. The definition of model training optimality should, therefore, be agreed by all participants before training. FedAvg 9 9 57 58 59 16 17 51 FedProx 57 58 18 Privatnost i bezbednost Healthcare data is highly sensitive and must be protected accordingly, following appropriate confidentiality procedures. Therefore, some of the key considerations are the trade-offs, strategies and remaining risks regarding the privacy-preserving potential of FL. Приватност у односу на перформансе: Важно је напоменути да ФЛ не решава све потенцијалне проблеме приватности и – слично алгоритмима МЛ уопште – увек ће носити неке ризике. Међутим, постоји компромис у погледу перформанси и ове технике могу утицати, на пример, на тачност коначног модела. Поред тога, будуће технике и/или помоћни подаци могу се користити за компромитовање модела који се раније сматрао ниским ризиком. 12 10 Ниво поверења: Широко говорећи, учеснице могу ући у две врсте ФЛ сарадње: —за ФЛ конзорцијуме у којима се све стране сматрају поузданим и обавезују их спроводиви споразум о сарадњи, можемо елиминисати многе од најнеповољнијих мотивација, као што су намерни покушаји да се извуку осетљиве информације или да се намерно корумпира модел. Верује —У ФЛ системима који раде на већој скали, може бити непрактично успоставити спроводиви споразум о сарадњи. Неки клијенти могу намерно покушати да деградирају перформансе, сруше систем или извуку информације од других страна. Стога ће бити потребне безбедносне стратегије за ублажавање ових ризика, као што су напредна шифровање подношења модела, сигурна аутентификација свих страна, праћење акција, диференцијална приватност, системи верификације, интегритет извршења, поверљивост модела и заштита од непријатељских напада. Непоуздани Information leakage: By definition, FL systems avoid sharing healthcare data among participating institutions. However, the shared information may still indirectly expose private data used for local training, e.g., by model inversion of the model updates, the gradients themselves или противнички напади , ФЛ се разликује од традиционалног тренинга у томе што је процес тренинга изложен више странака, чиме се повећава ризик од цурења путем реверзног инжењеринга ако противници могу да посматрају промене модела током времена, посматрају специфична ажурирања модела (тј. ажурирање једне институције), или манипулишу моделом (нпр. индукују додатно памћење од стране других кроз нападе у стилу градијента). , и обезбеђивање адекватне диференцијалне приватности , може бити потребна и још увек је активна област истраживања . 60 61 62 63 16 18 44 12 Tracibilnost i odgovornost Као и код свих безбедносно-критичних апликација, репродуктивност система је важна за ФЛ у здравству. За разлику од централизованог тренинга, ФЛ захтева мулти-партијско израчунавање у окружењима која показују значајну разноликост у смислу хардвера, софтвера и мрежа. Праћење свих системских средстава укључујући историју приступа подацима, конфигурације тренинга и хиперпараметарско подешавање током процеса тренинга је стога обавезно. Посебно у не-поузданим федерацијама, праћење и процеси одговорности захтевају интегритет извршења. Након што процес тренинга достигне међусобно договорене критеријуме за оптималност модела, такође може бити корисно измерити количину доприноса сваког уче Једна импликација ФЛ-а је да истраживачи нису у стању да истражују податке на којима се модели обучавају да би смислили неочекиване резултате. Штавише, узимање статистичких мерења њихових података о обуци као део радног тока за развој модела мораће бити одобрено од стране сарађујућих страна као што не крши приватност. Иако ће свака локација имати приступ сопственим сировим подацима, федерације могу одлучити да пруже неку врсту сигурне интра-ноде прегледа објеката како би задовољиле ову потребу или могу пружити неки други начин да повећају објашњивост и интерпретабилност глобалног модела. 64 Архитектура система Unlike running large-scale FL amongst consumer devices such as McMahan et al. , здравствени институционални учесници су опремљени релативно моћним рачунарским ресурсима и поузданим мрежама са већим проток који омогућавају обуку већих модела са много више локалних корака обуке и дељење више информација о моделу између чворова.Ове јединствене карактеристике ФЛ-а у здравству такође доносе изазове као што су осигурање интегритета података приликом комуникације помоћу редунантних чворова, дизајнирање сигурних метода шифровања како би се спречило цурење података, или дизајнирање одговарајућих распоредника чворова како би се најбоље искористили дистрибуирани рачунарски уређаји и смањило вријеме празнине. 9 The administration of such a federation can be realised in different ways. In situations requiring the most stringent data privacy between parties, training may operate via some sort of “honest broker” system, in which a trusted third party acts as the intermediary and facilitates access to data. This setup requires an independent entity controlling the overall system, which may not always be desirable, since it could involve additional cost and procedural viscosity. However, it has the advantage that the precise internal mechanisms can be abstracted away from the clients, making the system more agile and simpler to update. In a peer-to-peer system each site interacts directly with some or all of the other participants. In other words, there is no gatekeeper function, all protocols must be agreed up-front, which requires significant agreement efforts, and changes must be made in a synchronised fashion by all parties to avoid problems. Additionally, in a trustless-based architecture the platform operator may be cryptographically locked into being honest by means of a secure protocol, but this may introduce significant computational overheads. Закључак ML, a naročito DL, dovela je do širokog spektra inovacija u oblasti digitalne zdravstvene zaštite. Budući da sve metode ML imaju veliku korist od mogućnosti da pristupe podacima koji se približavaju istinskoj globalnoj distribuciji, FL je obećavajući pristup za dobijanje moćnih, preciznih, bezbednih, robusnih i nepristrasnih modela. Omogućavanjem više strana da obučavaju kolaborativno bez potrebe za razmenom ili centralizovanjem skupova podataka, FL čvrsto rešava probleme vezane za izlazak osetljivih medicinskih podataka. Kao posledica toga, FL može otvoriti nove istraživačke i poslovne puteve i ima potencijal za poboljšanje nege pacijenata širom sveta. Međutim, već danas, FL ima uticaj na gotovo sve zainteresovane strane i čitav ciklus lečenja Упркос томе, заиста верујемо да је његов потенцијални утицај на прецизну медицину и на крају побољшање медицинске неге веома обећавајући. 12 Izveštaj sažetak Више информација о дизајну истраживања доступно је у Povezano sa ovim člankom. Природни истраживачки извештај Резиме References LeCun, Y., Bengio, Y. & Hinton, G. Deep learning. , 436 (2015). Nature 521 Wang, F., Casalino, L. P. & Khullar, D. Deep learning in medicine—promise, progress, and challenges. , 293–294 (2019). JAMA Intern. Med. 179 Chartrand, G. et al. Deep learning: a primer for radiologists. , 2113–2131 (2017). Radiographics 37 De Fauw, J. et al. Clinically applicable deep learning for diagnosis and referral in retinal disease. , 1342 (2018). Nat. Med. 24 Sun, C., Shrivastava, A., Singh, S. & Gupta, A. Revisiting unreasonable effectiveness of data in deep learning era. In , 843–852 ( , 2017). Proceedings of the IEEE international conference on computer vision IEEE Van Panhuis, W. G. et al. A systematic review of barriers to data sharing in public health. , 1144 (2014). BMC Public Health 14 Rocher, L., Hendrickx, J. M. & De Montjoye, Y.-A. Estimating the success of re-identifications in incomplete datasets using generative models. , 1–9 (2019). Nat. Commun. 10 Schwarz, C. G. et al. Identification of anonymous mri research participants with face-recognition software. , 1684–1686 (2019). N. Engl. J. Med. 381 McMahan, B., Moore, E., Ramage, D., Hampson, S. & y Arcas, B. A. Communication-efficient learning of deep networks from decentralized data. In , 1273–1282. (2017). Artificial Intelligence and Statistics https://scholar.google.de/scholar?hl=de&as_sdt=0%2C5&q=Communicationefficient+learning+of+deep+networks+from+decentralized+data&btnG= Li, T., Sahu, A. K., Talwalkar, A. & Smith, V. Federated learning: Challenges, methods, and future directions. , 50–60 (IEEE, 2020). IEEE Signal Processing Magazine 37 Yang, Q., Liu, Y., Chen, T. & Tong, Y. Federated machine learning: concept and applications. , 12 (2019). ACM Trans. Intell. Syst. Technol. (TIST) 10 Kairouz, P. et al. Advances and open problems in federated learning. (2019). arXiv preprint arXiv:1912.04977 Lee, J. et al. Privacy-preserving patient similarity learning in a federated environment: development and analysis. , e20 (2018). JMIR Med. Inform. 6 Brisimi, T. S. et al. Federated learning of predictive models from federated electronic health records. , 59–67 (2018). Int. J. Med. Inform. 112 Roy, A. G., Siddiqui, S., Pölsterl, S., Navab, N. & Wachinger, C. Braintorrent: a peer-to-peer environment for decentralized federated learning. (2019). arXiv preprint arXiv:1905.06731 Li, W. et al. Privacy-preserving federated brain tumour segmentation. In , 133–141 (Springer, 2019). International Workshop on Machine Learning in Medical Imaging Sheller, M. J., Reina, G. A., Edwards, B., Martin, J. & Bakas, S. Multi-institutional deep learning modeling without sharing patient data: a feasibility study on brain tumor segmentation. In , 92–104 (Springer, 2018). International MICCAI Brainlesion Workshop Li, X. et al. Multi-site fmri analysis using privacy-preserving federated learning and domain adaptation: abide results. (2020). arXiv preprint arXiv:2001.05647 Huang, L. et al. Patient clustering improves efficiency of federated machine learning to predict mortality and hospital stay time using distributed electronic medical records. , 103291 (2019). J. Biomed. Inform. 99 Xu, J. & Wang, F. Federated learning for healthcare informatics. (2019). arXiv preprint arXiv:1911.06270 Roy, A. & Banerjee, A. Ibm’s merge healthcare acquisitio . (2015) (Accessed 10 February 2020). n https://www.reuters.com/article/us-merge-healthcare-m-a-ibm/ibm-to-buy-merge-healthcare-in-1-billion-deal-idUSKCN0QB1ML20150806 Nhs scotland’s national safe haven. (2015) (Accessed 10 February 2020). https://www.gov.scot/publications/charter-safe-havens-scotland-handling-unconsented-data-national-health-service-patient-records-support-research-statistics/pages/4/ Cuggia, M. & Combes, S. The french health data hub and the german medical informatics initiatives: Two national projects to promote data sharing in healthcare. , 195–202 (2019). Yearbook Med. Informat. 28 Health Data Research UK. (Health Data Research UK, 2020) (Accessed 10 Feb 2020). https://www.hdruk.ac.uk/ Sporns, O., Tononi, G. & Kötter, R. The human connectome: a structural description of the human brain. . , e42, (2005). PLoS Comput. Biol 1 https://doi.org/10.1371/journal.pcbi.0010042 Sudlow, C. et al. Uk biobank: an open access resource for identifying the causes of a wide range of complex diseases of middle and old age. . , e1001779. (2015). PLoS Med 12 https://doi.org/10.1371/journal.pmed.1001779 Clark, K. et al. The cancer imaging archive (tcia): maintaining and operating a public information repository. , 1045–1057 (2013). J. Digit. Imaging. 26 Wang, X. et al. Chestx-ray8: Hospital-scale chest X-ray database and benchmarks on weakly-supervised classification and localization of common thorax diseases. In , 2097–2106 ( , 2017). Proceedings of the IEEE conference on computer vision and pattern recognition IEEE Yan, K., Wang, X., Lu, L. & Summers, R. M. Deeplesion: automated mining of large-scale lesion annotations and universal lesion detection with deep learning. , 036501 (2018). J Med. Imaging. 5 Tomczak, K., Czerwińska, P. & Wiznerowicz, M. The cancer genome atlas (tcga): an immeasurable source of knowledge. , A68 (2015). Contemp. Oncol. 19 Jack Jr., C. R. et al. The alzheimer’s disease neuroimaging initiative (adni): Mri methods. , 685–691 (2008). J. Magn. Reson. Imaging 27 . (2020) (Accessed 24 July 2020). Grand Challenge-a Platform for End-to-end Development of Machine Learning Solutions in Biomedical Imaging https://grand-challenge.org/ Litjens, G. et al. 1399 h&e-stained sentinel lymph node sections of breast cancer patients: the camelyon dataset. , giy065 (2018). GigaScience 7 Menze, B. H. et al. The multimodal brain tumor image segmentation benchmark (brats). , 1993–2024 (2014). IEEE Trans. Med. Imaging 34 Bakas, S. et al. Identifying the best machine learning algorithms for brain tumor segmentation, progression assessment, and overall survival prediction in the brats challenge. (2018). arXiv preprint arXiv:1811.02629 Bakas, S. et al. Advancing the cancer genome atlas glioma MRI collections with expert segmentation labels and radiomic features. , 170117 (2017). Sci. Data 4 Simpson, A. L. et al. A large annotated medical image dataset for the development and evaluation of segmentation algorithms. (2019). arXiv preprint arXiv:1902.09063 Yeh, F.-C. et al. Quantifying differences and similarities in whole-brain white matter architecture using local connectome fingerprints. , e1005203 (2016). PLoS Comput. Biol. 12 Chang, K. et al. Distributed deep learning networks among institutions for medical imaging. , 945–954 (2018). J. Am. Med. Inform. Assoc. 25 Shokri, R., Stronati, M., Song, C. & Shmatikov, V. Membership inference attacks against machine learning models. In , 3-18 (IEEE, 2017). 2017 IEEE Symposium on Security and Privacy (SP) Sablayrolles, A., Douze, M., Ollivier, Y., Schmid, C. & Jégou, H. White-box vs black-box: Bayes optimal strategies for membership inference. In Chaudhuri, K. & Salakhutdinov, R. (eds) , 5558–5567. (PMLR, 2019). Proceedings of the 36th International Conference on Machine Learning, {ICML} 97 http://proceedings.mlr.press/v97/sablayrolles19a.html Zhang, C., Bengio, S., Hardt, M., Recht, B. & Vinyals, O. Understanding deep learning requires rethinking generalization. In , (OpenReview.net, 2017). 5th International Conference on Learning Representations, {ICLR}. https://openreview.net/forum?id=Sy8gdB9xx Carlini, N., Liu, C., Erlingsson, Ú., Kos, J. & Song, D. The secret sharer: evaluating and testing unintended memorization in neural networks. In Heninger, N. & Traynor, P. (eds) { } ({ } , 267–284. ({USENIX} Association, Santa Clara, CA, USA, 2019). 28th USENIX Security Symposium USENIX Security 19 https://www.usenix.org/conference/usenixsecurity19/presentation/carlini Abadi, M. et al. Deep learning with differential privacy. In , 308–318 (ACM, 2016). Proceedings of the 2016 ACM SIGSAC Conference on Computer and Communications Security Shokri, R. & Shmatikov, V. Privacy-preserving deep learning. In , 1310–1321 (ACM, 2015). Proceedings of the 22nd ACM SIGSAC conference on computer and communications security Langlotz, C. P. et al. A roadmap for foundational research on artificial intelligence in medical imaging: from the 2018 nih/rsna/acr/the academy workshop. , 781–791 (2019). Radiology 291 Kim, Y., Sun, J., Yu, H. & Jiang, X. Federated Tensor Factorization for Computational Phenotyping. In . 887–895. (ACM, Halifax, NS, Canada, 2017). Proceedings of the 23rd {ACM} {SIGKDD} International Conference on Knowledge Discoveryand Data Mining https://doi.org/10.1145/3097983.3098118 He, C., Annavaram, M. & Avestimehr, S. Fednas: Federated deep learning via neural architecture search. (2020). https://sites.google.com/view/cvpr20-nas/ Trustworthy federated data analytics (tfda). (2020) (Accessed 28 May 2020). https://tfda.hmsp.center/ Joint Imaging Platform (Jip). (2020) (Accessed 28 May 2020). https://jip.dktk.dkfz.de/jiphomepage/ Medical institutions collaborate to improve mammogram assessment ai. (2020) (Accessed 28 May 2020). https://blogs.nvidia.com/blog/2020/04/15/federated-learning-mammogram-assessment/ Healthchain consortium. (2020) (Accessed 28 May 2020). https://www.substra.ai/en/healthchain-project The federated tumor segmentation (fets) initiative. (2020) (Accessed 28 May 2020). https://www.fets.ai Machine learning ledger orchestration for drug discovery. (2020). Accessed 28 May 2020. https://cordis.europa.eu/project/id/831472 Konečny`, J., McMahan, H. B., Ramage, D. & Richtárik, P. Federated optimization: Distributed machine learning for on-device intelligence. (2016). arXiv preprint arXiv:1610.02527 Lalitha, A., Kilinc, O. C., Javidi, T. & Koushanfar, F. Peer-to-peer federated learning on graphs. (2019). arXiv preprint arXiv:1901.11173 Li, T., Sahu, A. K., Zaheer, M., Sanjabi, M., Talwalkar, A. & Smith, V. Federated optimization in heterogeneous networks. (2018). arXiv preprint arXiv:1812.06127 Zhao, Y. et al. Federated learning with non-iid data. (2018). arxivabs/1806.00582 Li, X., Huang, K., Yang, W., Wang, S. & Zhang, Z. On the convergence of fedavg on non-IID data. (2020). https://openreview.net/forum?id=HJxNAnVtDS Wu, B. et al. P3sgd: patient privacy preserving SGD for regularizing deep CNNs in pathological image classification. In (pp. 2099–2108) (2019). Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition Zhu, L., Liu, Z. & Han, S. Deep leakage from gradients. In Wallach, H. M. et al. (eds) , 14747–14756. (2019). Advances in Neural Information Processing Systems 32: Annual Conference on Neural Information Processing Systems http://papers.nips.cc/paper/9617-deep-leakage-from-gradients Wang, Z. et al. Beyond inferring class representatives: user-level privacy leakage from federated learning. In 2512–2520. (IEEE, Paris, France, 2019). 2019 {IEEE} Conferenceon Computer Communications, {INFOCOM} https://doi.org/10.1109/INFOCOM.2019.8737416 Hitaj, B., Ateniese, G. & Perez-Cruz, F. Deep models under the gan: information leakage from collaborative deep learning. In , CCS’17, 603–618 (Association for Computing Machinery, New York, NY, USA, 2017). Proceedings of the 2017 ACM SIGSAC Conference on Computer and Communications Security Ghorbani, A. & Zou, J. Data shapley: Equitable valuation of data for machine learning. In (pp. 2242-2251) (2019). International Conference on Machine Learning признања Овај рад је подржао Британски истраживачки и иновативни центар за медицинско сликање и вештачку интелигенцију у Лондону за здравствену заштиту засновану на вредностима, Одсек за медицинско инжењерство Велцхоме / ЕПСЦЦЦ (ВТ203148 / З/16 / З), Флагмански програм Велцхоме (ВТ213038 / З/18 / З), Интрамурални истраживачки програм Националних института за здравље (НИХ) Клинички центар, Национални институт за рак НИХ-а под награђиваним бројем У01ЦА242871, Национални институт за неуролошке поремећаје и мождани удар НИХ-а под награђеним бројем Р01НС042645, као и Хелмхолтз Иницијативе и Мре Овај чланак је доступан у природи под лиценцом CC by 4.0 Deed (Attribution 4.0 International). Ovaj papir je under CC by 4.0 Deed (Attribution 4.0 International) license. Доступно у природи