Автори на: Nicola Rieke Jonny Hancox Венеција Ли Fausto Milletarì Holger R. Roth Shadi Albarqouni Spyridon Bakas Mathieu N. Galtier Bennett A. Landman Klaus Maier-Hein Sébastien Ourselin Micah Sheller Ronald M. Summers Andrew Trask Daguang Xu Maximilian Baust M. Jorge Cardoso Автори на: Никола Рике Џони Ханкокс Венеција Ли Фаусто Милетари Холгер Р. Рот Шади Албаркуни Спиридон Бакас Матије Н. Галтие Беннет А. Лендман Клаус Мајер-Хејн Себастијан Оурселин Мика Шелер Роналд М. Самерс Андреј Траск Дагуан Су Максимилијан Бауст Хорхе Кардосо апстракција Постоечките медицински податоци не се целосно искористени од ML првенствено затоа што се наоѓа во силоси на податоци и загриженоста за приватноста го ограничува пристапот до овие податоци. Меѓутоа, без пристап до доволно податоци, ML ќе биде спречено да го достигне својот целосен потенцијал и, на крајот, да направи транзиција од истражување во клиничка пракса. Оваа статија ги разгледува клучните фактори кои придонесуваат за ова прашање, истражува како федеративното учење (FL) може да обезбеди решение за иднината на дигиталното здравје и ги истакнува предизвиците и размислувањата што треба да се решат. Воведување Истражување на вештачката интелигенција (AI), а особено напредокот во машинското учење (ML) и длабокото учење (DL) Модерните DL модели содржат милиони параметри кои треба да се научат од доволно големи курирани податоци за да се постигне клиничка точност, додека се безбедни, фер, фер и генерализираат добро до невидливи податоци , , , . 1 2 3 4 5 На пример, обуката на детектор на тумори базиран на АИ бара голема база на податоци која го опфаќа целиот спектар на можни анатомии, патологии и типови на податоци за влез. Дури и ако анонимизацијата на податоците би можела да ги заобиколат овие ограничувања, сега е добро разбрано дека отстранувањето на метаподатоците како име на пациентот или датум на раѓање често не е доволно за да се зачува приватноста. На пример, можно е да се реконструира лицето на пациентот од компјутерска томографија (КТ) или магнетна резонанца (МРИ) податоци. Друга причина зошто споделувањето на податоци не е систематско во здравството е тоа што собирањето, уредувањето и одржувањето на висококвалитетен сет на податоци бара значително време, напор и трошоци.Соодветно на тоа, таквите сетови на податоци може да имаат значителна деловна вредност, што го прави помалку веројатно дека ќе бидат слободно споделени. 6 7 8 Федерално учење (FL) , , е парадигма за учење која се обидува да го реши проблемот на управување со податоците и приватноста со обука на алгоритми соработно без размена на самите податоци. , неодамна стекна влечење за здравствените апликации , , , , , , , ФЛ овозможува заедничко стекнување на увид, на пример, во форма на модел на консензус, без да се движат податоците на пациентите надвор од заштитните ѕидови на институциите во кои тие живеат. Неодамнешните истражувања покажаа дека моделите обучени од FL можат да постигнат нивоа на перформанси споредливи со оние обучени на централно хостирани податоци и подобри од моделите кои гледаат само изолирани едноинституционални податоци. , . 9 10 11 12 13 14 15 16 17 18 19 20 1 16 17 FL агрегација сервер – типичен FL работен тек во кој федерација на тренинг јазли го прима глобалниот модел, ги препраќа своите делумно обучени модели на централен сервер интермитентно за агрегација и потоа продолжува со обуката на консензус модел што серверот го враќа. FL peer to peer – алтернативна формулација на FL во која секој обучен јазол ги разменува своите делумно обучени модели со некои или сите свои врсници и секој прави своја агрегација. Централизирано обука – општ работен тек за обука во кој сајтовите за стекнување на податоци ги донираат своите податоци во централно езеро на податоци од кое тие и другите можат да извлечат податоци за локално, независно обука. a b c A successful implementation of FL could thus hold a significant potential for enabling precision medicine at large-scale, leading to models that yield unbiased decisions, optimally reflect an individual’s physiology, and are sensitive to rare diseases while respecting governance and privacy concerns. However, FL still requires rigorous technical consideration to ensure that the algorithm is proceeding optimally without compromising safety or patient privacy. Nevertheless, it has the potential to overcome the limitations of approaches that require a single pool of centralised data. Ние предвидуваме федерализирана иднина за дигитално здравје и со оваа перспектива хартија, ние го споделуваме нашиот консензус со цел да се обезбеди контекст и детали за заедницата во врска со придобивките и влијанието на ФЛ за медицински апликации (секција "Датотеки-ориентирана медицина бара федерализирани напори"), како и истакнување на клучните размислувања и предизвици на имплементација на ФЛ за дигитално здравје (секција "Технички размислувања"). Медицината базирана на податоци бара федерализирани напори ML и особено DL станува де факто пристап за откривање на знаење во многу индустрии, но успешно имплементација на податоци-ориентирани апликации бара големи и разновидни сетови на податоци. Сепак, медицински сетови на податоци се тешко да се добие (подсекција "Зависноста од податоци"). FL се занимава со овој проблем со овозможување на колаборативно учење без централизирање на податоци (подсекција "Ветување на федерација напори") и веќе го најде својот пат до дигитални здравствени апликации (подсекција "Тековни FL напори за дигитално здравје"). Зависност од податоците Додека ова е добро познато барање, најсовремени алгоритми обично се оценуваат на внимателно курирани збирки на податоци, често потекнувајќи од само неколку извори. Ова може да воведе предрасуди каде што демографијата (на пример, пол, возраст) или техничките нерамнотежи (на пример, протокол за стекнување, производител на опрема) ги искривуваат предвидувањата и негативно влијаат на точноста за одредени групи или локации. Потребата за големи бази на податоци за обука за вештачка интелигенција предизвика многу иницијативи кои сакаат да ги комбинираат податоците од повеќе институции. Овие податоци често се собираат во таканаречените Data Lakes. Овие се изградени со цел да се искористи комерцијалната вредност на податоците, на пример, IBM Merge Healthcare. , или како ресурс за економски раст и научен напредок, на пример, Националната безбедна лука на NHS Шкотска Француски центар за здравствени податоци Истражување на здравствените податоци во Велика Британија . 21 22 23 24 Суштински, иако помали, иницијативи вклучуваат Human Connectome Британската Биобанка Архива за слики од рак (TCIA) Нејзиниот CXR8 Неговата длабочина Атлас на геномите на ракот (TCGA) Алцхајмеровата болест Неуроизобразување Иницијатива (ADNI) Како и големите медицински предизвици Како до предизвикот на Камелион Меѓународната мултимодална сегментација на тумори на мозокот (BraTS) , , Медицинска сегментација Decathlon Јавните медицински податоци обично се специфични за задачата или болеста и често се издаваат со различни степени на ограничувања на лиценцата, понекогаш ограничувајќи ја неговата експлоатација. 25 26 27 28 29 30 31 32 33 34 35 36 37 Централизацијата или објавувањето на податоците, сепак, претставува не само регулаторни, етички и правни предизвици, поврзани со приватноста и заштитата на податоците, туку и технички предизвици. Анонимизирање, контрола на пристапот и безбедно пренесување на здравствените податоци е нетривијална, а понекогаш и невозможна задача. Истото важи и за геномските податоци и медицинските слики што ги прават уникатни како отпечатоци од прсти. Затоа, освен ако процесот на анонимизација не ја уништи верноста на податоците, што веројатно ќе ги направи бескорисни, повторно идентификување на пациентот или излегување на информации не може да се исклучи. 7 38 Ветувањето на федеративните напори Ветувањето на ФЛ е едноставно – да се справат со предизвиците за приватност и управување со податоци со овозможување на МЛ од не-ко-лоцирани податоци. Во поставувањето ФЛ, секој контролор на податоци не само што ги дефинира сопствените процеси за управување и сродните политики за приватност, туку и го контролира пристапот до податоците и има способност да ги повлече. Ова вклучува и обуката, како и фазата на валидација. На овој начин, ФЛ може да создаде нови можности, на пример, со овозможување на широкомасштабна, во-институционална валидација, или со овозможување на ново истражување за ретки болести, каде што стапките на инциденти се ниски, а податоците во секоја институција се премногу мали. Преместувањето на моделот на податоците Како што е прикажано во Фиг. , FL работен тек може да се реализира со различни топологии и компјутерски планови.Двете најчести за здравствени апликации се преку сервер за агрегација , , и peer to peer се приближува , Во сите случаи, ФЛ имплицитно нуди одреден степен на приватност, бидејќи учесниците на ФЛ никогаш не пристапуваат директно до податоците од други институции и примаат само параметри на моделот кои се агрегирани во текот на неколку учесници. Во FL работен тек со сервер за агрегирање, учесниците можат дури и да останат непознати едни на други. , , , Затоа, механизми како диференцијална приватност , или учење од шифрирани податоци е предложено за понатамошно подобрување на приватноста во FL поставувањето (види дел „Технички размислувања“). и ФЛ техники се растечка област на истражување , . 2 16 17 18 15 39 40 41 42 43 44 45 46 12 20 ФЛ топологии – комуникациска архитектура на федерација. Централизиран: серверот за агрегација ги координира итерациите за обука и ги собира, агрегира и дистрибуира моделите до и од нодовите за обука (Hub & Spoke). Децентрализиран: секој тренинг јазол е поврзан со еден или повеќе врсници и агрегацијата се случува на секој јазол паралелно. Иерархиски: федеративните мрежи може да се состојат од неколку под-федерации, кои може да се изградат од мешавина на Peer-to-Peer и Aggregation Server федерации ( FL компјутерски планови – траекторија на моделот преку неколку партнери. Секуенцијална обука / циклично учење за трансфер. Агрегација на сервери, Петар е петар. a b c d e f g Тековни напори на ФЛ за дигитално здравје Бидејќи FL е општа парадигма за учење која ги отстранува барањата за спојување на податоци за развој на модели на АИ, опсегот на апликации на FL го опфаќа целиот спектар на АИ за здравствена заштита. Во контекст на електронски здравствени записи (EHR), на пример, FL помага да се претстават и да се најдат клинички слични пациенти , , како и предвидување на хоспитализации поради срцеви настани , смртност и ICU престој време Применливоста и предностите на ФЛ исто така се докажани во областа на медицинската слика, за целата сегментација на мозокот во МРИ. , како и сегментација на туморот на мозокот , Неодамна, техниката е употребена за fMRI класификација за да се најдат сигурни биомаркери поврзани со болеста. и предложени како ветувачки пристап во контекст на COVID-19 . 13 47 14 19 15 16 17 18 48 Вреди да се напомене дека напорите на ФЛ бараат договори за да се дефинираат опсегот, целта и технологиите што се користат, кои, бидејќи се уште се нови, може да бидат тешко да се дефинираат. Тие вклучуваат конзорциуми кои имаат за цел да го унапредат истражување, како што е проектот Trustworthy Federated Data Analytics (TFDA) Заедничка платформа за слики на Германскиот конзорциум за рак , кои овозможуваат децентрализирано истражување низ германските истражувачки институции за медицинска слика.Друг пример е меѓународна истражувачка соработка која го користи FL за развој на модели на АИ за проценка на мамографиите Студијата покажа дека моделите генерирани од FL ги надминаа оние обучени на податоците на еден институт и беа повеќе генерализирани, така што сè уште работеа добро на податоците на другите институти. академски 49 50 51 Со поврзување на здравствените институции, кои не се ограничени на истражувачки центри, ФЛ може да има директна impact.The ongoing HealthChain проект , на пример, има за цел да развие и распореди FL рамка во четири болници во Франција. Ова решение генерира заеднички модели кои можат да го предвидат одговорот на третманот за пациенти со рак на дојка и меланома. Тоа им помага на онколозите да го утврдат најефикасниот третман за секој пациент од нивните хистолошки слајдови или дермоскопија слики. , која е меѓународна федерација од 30 посветени здравствени институции кои користат рамка FL со отворен код со графички кориснички интерфејс. Целта е да се подобри детекцијата на границите на туморите, вклучувајќи го и глиомот на мозокот, туморите на дојката, туморите на црниот дроб и лезиите на коските од повеќе пациенти со миелом. Клинички 52 53 Друга област на влијание е во истражување и превод. FL овозможува соработка за истражување, дури и за конкурентни компании. Во овој контекст, една од најголемите иницијативи е проектот Melloddy Тоа е проект со цел да се имплементира мултитаски ФЛ во податоците на 10 фармацевтски компании.Со обука на заеднички предвидувачки модел, кој подразбира како хемиските соединенија се врзуваат за протеини, партнерите имаат намера да го оптимизираат процесот на откривање на лекови без да ги откријат своите високо вредни внатрешни податоци. Индустриски 54 Влијание врз засегнатите страни ФЛ вклучува промена на парадигмата од централизираните езера на податоци и важно е да се разбере неговото влијание врз различните актери во екосистемот на ФЛ. Клиничари Клиничарите обично се изложени на подгрупа на населението врз основа на нивната локација и демографската средина, што може да предизвика пристрасни претпоставки за веројатноста за одредени болести или нивната меѓусебна поврзаност. Со користење на системи базирани на ML, на пример, како втор читател, тие можат да ја зголемат својата експертиза со стручно знаење од други институции, обезбедувајќи конзистентност на дијагнозата што денес не може да се постигне. Додека ова се однесува на системот базиран на ML воопшто, системите обучени на федерализиран начин потенцијално се способни да донесат уште помалку пристрасни одлуки и поголема чувствителност кон ретки случаи, бидејќи веројатно биле изложени на поцелосно дистрибуција на податоци. Сепак, ова бара извесен напор Пациентите Пациентите обично се лекуваат локално. Воспоставувањето на ФЛ на глобално ниво би можело да обезбеди висок квалитет на клинички одлуки без оглед на локацијата на третманот. Особено, пациентите кои бараат медицинска помош во оддалечени области би можеле да имаат корист од истите висококвалитетни МЛ-помогнати дијагнози кои се достапни во болниците со голем број случаи. Истото важи и за ретки, или географски ретки, болести, кои најверојатно ќе имаат помали последици ако може да се направат побрзи и попрецизни дијагнози. Болници и практики Болниците и практиките можат да останат во целосна контрола и поседување на своите податоци за пациентите со целосна трагабилност на пристапот до податоците, ограничувајќи го ризикот од злоупотреба од страна на трети лица. Сепак, ова ќе бара инвестиции во инфраструктура за компјутери на локално ниво или обезбедување на приватни услуги во облак и придржување кон стандардизирани и синоптички формати на податоци, така што ML моделите можат да се обучуваат и да се оценуваат беспрекорно. Истражувачи и AI програмери Истражувачите и програмерите на вештачка интелигенција имаат корист од пристапот до потенцијално огромна збирка податоци од реалниот свет, што сигурно ќе влијае на помалите истражувачки лаборатории и стартапи.На тој начин, ресурсите може да се насочат кон решавање на клиничките потреби и поврзаните технички проблеми, наместо да се потпираат на ограничената понуда на отворени податоци.Во исто време, ќе биде неопходно да се спроведат истражувања за алгоритамски стратегии за федеративно обука, на пример, како ефикасно да се комбинираат модели или ажурирања, како да се биде стабилен за дистрибутивните промени. , , ФЛ-базираниот развој исто така подразбира дека истражувачот или програмерот на АИ не може да ги испита или визуелизира сите податоци на кои е обучен моделот, на пример, не е можно да се погледне на поединечен случај на неуспех за да се разбере зошто тековниот модел работи лошо на него. 11 12 20 здравствени даватели Обезбедувачите на здравствена заштита во многу земји се погодени од тековната парадигма промена од базирана на обем, т.е. базирана на плата за услуга, на здравствена заштита базирана на вредност, која, пак, е силно поврзана со успешното воспоставување на прецизна медицина. Ова не е за промовирање на поскапи индивидуализирани терапии, туку за постигнување на подобри резултати порано преку повеќе фокусирано лекување, со што се намалуваат трошоците. Производители Производителите на здравствени софтвер и хардвер, исто така, би можеле да имаат корист од FL, бидејќи комбинирањето на учењето од многу уреди и апликации, без откривање на специфични информации за пациентот, може да ја олесни континуираната валидација или подобрување на нивните системи базирани на ML. Технички размислувања ФЛ е можеби најпознат од работата на Konečnỳ et al. , но разни други дефиниции се предложени во литературата , , , А FL работен тек (Слика. ) може да се реализира преку различни топологии и компјутерски планови (Фиг. ), но целта останува иста, односно да се комбинираат знаењата стекнати од не-ко-лоцирани податоци.Во овој дел, ќе разговараме подетално за тоа што е FL, како и да ги истакнеме клучните предизвици и техничките размислувања кои произлегуваат кога се применува FL во дигиталното здравје. 55 9 11 12 20 1 2 Дефиниција на федерално учење FL е парадигма за учење во која повеќе страни се обучуваат заеднички без потреба да се разменуваат или централизираат збирките на податоци. локални загуби, пресметани од приватни податоци , која престојува кај поединечните засегнати страни и никогаш не е поделена меѓу нив: K XК Каде > 0 ги означува соодветните коефициенти на тежина. ВК Во пракса, секој учесник обично добива и усовршува глобален модел на консензус со спроведување на неколку кругови на оптимизација на локално ниво и пред споделување на ажурирања, директно или преку сервер на параметри. ) , Фактичкиот процес за агрегирање на параметрите зависи од мрежната топологија, бидејќи јазлите може да бидат сегрегирани во под-мрежи поради географски или правни ограничувања (види Фиг. Стратегиите за агрегирање може да се потпираат на еден агрегирачки јазол (модели на јазол и говорници) или на повеќе јазоли без никаква централизација. , Забелешка: Стратегиите за агрегирање не бараат информации за целосното ажурирање на моделот; клиентите би можеле да изберат да споделат само дел од параметрите на моделот за да се намали комуникацијата и да се обезбеди подобро зачувување на приватноста. или да произведат алгоритми за учење на повеќе задачи со само дел од нивните параметри научени на федератиран начин. 1 9 12 2 15 56 10 Единствена рамка која овозможува различни шеми за обука може да ги одвои компјутерските ресурси (податоци и сервери) од Како што е прикажано во Фиг. Последниот ја дефинира траекторијата на моделот низ неколку партнери, кои треба да бидат обучени и оценети на специфични збирки на податоци. Компјутерски план 2 Предизвици и размислувања И покрај предностите на FL, тоа не ги решава сите проблеми кои се својствени за учење на медицински податоци.Успешен модел обука се уште зависи од фактори како што се квалитетот на податоците, пристрасност и стандардизација Овие прашања мора да се решат и за федеративните и за не-федеративните напори за учење преку соодветни мерки, како што се внимателен дизајн на студии, заеднички протоколи за стекнување на податоци, структурирано известување и софистицирани методологии за откривање на пристрасност и скриена стратификација. Во продолжение, ние се однесуваме на клучните аспекти на FL кои се особено релевантни кога се применуваат на дигиталното здравје и треба да се земат предвид при воспоставување на FL. , , . 2 11 12 20 Хетерогеност на податоци Медицинските податоци се особено разновидни – не само поради разновидноста на модалитети, димензионалноста и карактеристиките воопшто, туку дури и во рамките на специфичен протокол поради фактори како што се разликите во стекнувањето, брендот на медицинскиот уред или локалната демографија. FL може да помогне да се справат со одредени извори на предрасуди преку потенцијално зголемена разновидност на извори на податоци, но нехомогената дистрибуција на податоците претставува предизвик за FL алгоритми и стратегии, бидејќи многумина претпоставуваат независно и идентично дистрибуирани (IID) податоци низ учесниците. Тие се склони да пропаднат под овие услови. , , , делумно победувајќи ја самата цел на стратегии за соработка за учење.Неодамнешните резултати, сепак, укажуваат на тоа дека обуката за ФЛ е сè уште изводлива , дури и ако медицинските податоци не се рамномерно распределени низ институциите , Или вклучува локален биас Истражувањата за решавање на овој проблем вклучуваат, на пример, Стратегија за делумно споделување на податоци и FL со домен-адаптација Друг предизвик е дека хетерогеноста на податоците може да доведе до ситуација во која глобалното оптимално решение не може да биде оптимално за поединечен локален учесник. Фудбалот 9 9 57 58 59 16 17 51 ФЕДПРОКС 57 58 18 Privacy and security Здравствените податоци се високо чувствителни и мора да бидат заштитени соодветно, по соодветни процедури за доверливост.Затоа, некои од клучните размислувања се компромисите, стратегиите и преостанатите ризици во однос на потенцијалот за зачувување на приватноста на FL. Приватност против перформанси: Важно е да се напомене дека FL не ги решава сите потенцијални проблеми со приватноста и – слично на ML алгоритмите воопшто – секогаш ќе носат некои ризици. . However, there is a trade-off in terms of performance and these techniques may affect, for example, the accuracy of the final model Покрај тоа, идните техники и/или помошни податоци би можеле да се користат за да се компрометира моделот кој претходно се сметаше за низок ризик. 12 10 Ниво на доверба: Општо земено, учесниците можат да влезат во два вида на FL соработка: -за конзорциумите на ФЛ во кои сите страни се сметаат за доверливи и се обврзани со спроведувачки договор за соработка, можеме да ги елиминираме многу од повеќе штетните мотивации, како на пример намерно обиди да се извлечат чувствителни информации или намерно да се расипа моделот. Доверба Во FL системи кои работат на поголеми скали, може да биде непрактично да се воспостави спроведувачки договор за соработка. Некои клиенти може намерно да се обидат да ги намалат перформансите, да го намалат системот или да извлечат информации од други страни. Затоа, ќе бидат потребни безбедносни стратегии за ублажување на овие ризици, како што се напредно шифрирање на поднесувањата на моделите, безбедна аутентификација на сите страни, трагабилност на активностите, диференцијална приватност, системи за верификација, интегритет на извршување, доверливост на моделите и заштита од напади на противници. Недоверба По дефиниција, системите на ФЛ ги избегнуваат споделувањето на здравствените податоци меѓу учесниците. Меѓутоа, споделените информации сè уште може индиректно да ги изложат приватните податоци кои се користат за локално обука, на пример, преку инверзија на моделот. од моделот ажурирања, самите градиенти или противнички напади , ФЛ се разликува од традиционалната обука во тоа што процесот на обука е изложен на повеќе страни, со што се зголемува ризикот од излегување преку обратен инженеринг ако противниците можат да ги набљудуваат промените во моделот со текот на времето, да ги набљудуваат специфичните ажурирања на моделот (т.е. ажурирање на една институција), или да го манипулираат моделот (на пример, да предизвикаат дополнително меморирање од страна на другите преку напади во стилот на градиент-ассент). , и обезбедување на соодветна диференцијална приватност , може да биде потребно и се уште е активна област на истражување . 60 61 62 63 16 18 44 12 Следење и одговорност Како и кај сите безбедносно-критични апликации, репродуктивноста на системот е важна за ФЛ во здравството. За разлика од централизираното обука, ФЛ бара мулти-партиски пресметки во средини кои покажуваат значителна разновидност во однос на хардвер, софтвер и мрежи. Проследувањето на сите системски средства вклучувајќи ја историјата на пристап до податоци, конфигурациите за обука и хиперпараметарското прилагодување во текот на процесите на обука е задолжително. Особено во не-доверливи федерации, процесите на следење и одговорност бараат интегритет на извршување. Откако процесот на обука ги достигнува критериумите за оптималноста на моделот, исто така може да биде корисно да се измери износот на придонесот Една импликација на ФЛ е дека истражувачите не можат да ги истражуваат податоците врз кои моделите се обучуваат за да значат неочекувани резултати. Покрај тоа, земајќи статистички мерења на нивните податоци за обука како дел од работниот тек за развој на моделот ќе треба да бидат одобрени од страна на соработувачките страни како што не ја кршат приватноста. Иако секој сајт ќе има пристап до сопствените сурови податоци, федерациите може да одлучат да обезбедат некаков вид на безбеден објект за гледање во внатрешни јазли за да ја задоволат оваа потреба или може да обезбедат некој друг начин за зголемување на објаснувањето и толкувањето на глобалниот модел. 64 Архитектура на системот За разлика од работењето на големиот FL меѓу потрошувачките уреди како што се McMahan et al. Учесниците во здравствените институции се опремени со релативно моќни пресметковни ресурси и сигурни мрежи со повисок проток што овозможуваат обука на поголеми модели со многу повеќе локални чекори за обука и споделување на повеќе модели на информации помеѓу јазли.Овие уникатни карактеристики на FL во здравствената заштита исто така носат предизвици како што се обезбедување на интегритет на податоците при комуникација со користење на излишни јазли, дизајнирање на безбедни методи за шифрирање за да се спречи истекување на податоците или дизајнирање на соодветни нодуларни планирачи за да се направи најдобро користење на дистрибуираните компјутерски уреди и да се намали времето на празно време. 9 Администрацијата на таква федерација може да се реализира на различни начини. Во ситуации кои бараат најстрога приватност на податоците меѓу страните, обуката може да работи преку некој вид "почесен брокер" систем, во кој доверливата трета страна дејствува како посредник и го олеснува пристапот до податоците. Оваа конфигурација бара независен ентитет кој го контролира целокупниот систем, што не може секогаш да биде пожелно, бидејќи може да вклучува дополнителни трошоци и процедурална вискозитет. Сепак, има предност дека точните внатрешни механизми може да се апстрагираат од клиентите, правејќи го системот поагилен и поедноставен за ажурирање. Во системот peer-to-peer секој сајт комуницира директно со некои или сите други учесници. Со други збо Conclusion ML, а особено DL, доведе до широк спектар на иновации во областа на дигиталната здравствена заштита. Како што сите ML методи имаат голема корист од способноста да пристапуваат до податоци кои се приближуваат до вистинската глобална дистрибуција, FL е ветувачки пристап за да се добијат моќни, точни, безбедни, цврсти и непристрасни модели. Со овозможување на повеќе страни да се обучуваат заеднички без потреба да се разменуваат или централизираат сетови на податоци, FL нежно ги решава прашањата поврзани со излегувањето на чувствителни медицински податоци. Како последица на тоа, може да отвори нови истражувачки и деловни патишта и има потенцијал за подобрување на грижата за пациентите на глобално ниво. Сепак, веќе денес, FL има влијание врз речиси сите заинтересирани И покрај тоа, ние навистина веруваме дека нејзиното потенцијално влијание врз прецизната медицина и на крајот подобрување на медицинската нега е многу ветувачки. 12 Reporting summary Дополнителни информации за дизајнот на истражувањето се достапни во поврзани со оваа статија. Природни истражувачки извештаи Референци LeCun, Y., Bengio, Y. & Hinton, G. Deep learning. , 436 (2015). Nature 521 Wang, F., Casalino, L. P. & Khullar, D. Deep learning in medicine—promise, progress, and challenges. , 293–294 (2019). JAMA Intern. Med. 179 Chartrand, G. et al. Deep learning: a primer for radiologists. , 2113–2131 (2017). Radiographics 37 De Fauw, J. et al. Clinically applicable deep learning for diagnosis and referral in retinal disease. , 1342 (2018). Nat. Med. 24 Sun, C., Shrivastava, A., Singh, S. & Gupta, A. Revisiting unreasonable effectiveness of data in deep learning era. In , 843–852 ( , 2017). Proceedings of the IEEE international conference on computer vision IEEE Van Panhuis, W. G. et al. A systematic review of barriers to data sharing in public health. , 1144 (2014). BMC Public Health 14 Rocher, L., Hendrickx, J. M. & De Montjoye, Y.-A. Estimating the success of re-identifications in incomplete datasets using generative models. , 1–9 (2019). Nat. Commun. 10 Schwarz, C. G. et al. Identification of anonymous mri research participants with face-recognition software. , 1684–1686 (2019). N. Engl. J. Med. 381 McMahan, B., Moore, E., Ramage, D., Hampson, S. & y Arcas, B. A. Communication-efficient learning of deep networks from decentralized data. In , 1273–1282. (2017). Artificial Intelligence and Statistics https://scholar.google.de/scholar?hl=de&as_sdt=0%2C5&q=Communicationefficient+learning+of+deep+networks+from+decentralized+data&btnG= Li, T., Sahu, A. K., Talwalkar, A. & Smith, V. Federated learning: Challenges, methods, and future directions. , 50–60 (IEEE, 2020). IEEE Signal Processing Magazine 37 Yang, Q., Liu, Y., Chen, T. & Tong, Y. Federated machine learning: concept and applications. , 12 (2019). ACM Trans. Intell. Syst. Technol. (TIST) 10 Kairouz, P. et al. Advances and open problems in federated learning. (2019). arXiv preprint arXiv:1912.04977 Lee, J. et al. Privacy-preserving patient similarity learning in a federated environment: development and analysis. , e20 (2018). JMIR Med. Inform. 6 Brisimi, T. S. et al. Federated learning of predictive models from federated electronic health records. , 59–67 (2018). Int. J. Med. Inform. 112 Roy, A. G., Siddiqui, S., Pölsterl, S., Navab, N. & Wachinger, C. Braintorrent: a peer-to-peer environment for decentralized federated learning. (2019). arXiv preprint arXiv:1905.06731 Li, W. et al. Privacy-preserving federated brain tumour segmentation. In , 133–141 (Springer, 2019). International Workshop on Machine Learning in Medical Imaging Sheller, M. J., Reina, G. A., Edwards, B., Martin, J. & Bakas, S. Multi-institutional deep learning modeling without sharing patient data: a feasibility study on brain tumor segmentation. In , 92–104 (Springer, 2018). International MICCAI Brainlesion Workshop Li, X. et al. Multi-site fmri analysis using privacy-preserving federated learning and domain adaptation: abide results. (2020). arXiv preprint arXiv:2001.05647 Huang, L. et al. Patient clustering improves efficiency of federated machine learning to predict mortality and hospital stay time using distributed electronic medical records. , 103291 (2019). J. Biomed. Inform. 99 Xu, J. & Wang, F. Federated learning for healthcare informatics. (2019). arXiv preprint arXiv:1911.06270 Roy, A. & Banerjee, A. Ibm’s merge healthcare acquisitio . (2015) (Accessed 10 February 2020). n https://www.reuters.com/article/us-merge-healthcare-m-a-ibm/ibm-to-buy-merge-healthcare-in-1-billion-deal-idUSKCN0QB1ML20150806 Nhs scotland’s national safe haven. (2015) (Accessed 10 February 2020). https://www.gov.scot/publications/charter-safe-havens-scotland-handling-unconsented-data-national-health-service-patient-records-support-research-statistics/pages/4/ Cuggia, M. & Combes, S. The french health data hub and the german medical informatics initiatives: Two national projects to promote data sharing in healthcare. , 195–202 (2019). Yearbook Med. Informat. 28 Health Data Research UK. (Health Data Research UK, 2020) (Accessed 10 Feb 2020). https://www.hdruk.ac.uk/ Sporns, O., Tononi, G. & Kötter, R. The human connectome: a structural description of the human brain. . , e42, (2005). PLoS Comput. Biol 1 https://doi.org/10.1371/journal.pcbi.0010042 Sudlow, C. et al. Uk biobank: an open access resource for identifying the causes of a wide range of complex diseases of middle and old age. . , e1001779. (2015). PLoS Med 12 https://doi.org/10.1371/journal.pmed.1001779 Clark, K. et al. The cancer imaging archive (tcia): maintaining and operating a public information repository. , 1045–1057 (2013). J. Digit. Imaging. 26 Wang, X. et al. Chestx-ray8: Hospital-scale chest X-ray database and benchmarks on weakly-supervised classification and localization of common thorax diseases. In , 2097–2106 ( , 2017). Proceedings of the IEEE conference on computer vision and pattern recognition IEEE Yan, K., Wang, X., Lu, L. & Summers, R. M. Deeplesion: automated mining of large-scale lesion annotations and universal lesion detection with deep learning. , 036501 (2018). J Med. Imaging. 5 Tomczak, K., Czerwińska, P. & Wiznerowicz, M. The cancer genome atlas (tcga): an immeasurable source of knowledge. , A68 (2015). Contemp. Oncol. 19 Jack Jr., C. R. et al. The alzheimer’s disease neuroimaging initiative (adni): Mri methods. , 685–691 (2008). J. Magn. Reson. Imaging 27 . (2020) (Accessed 24 July 2020). Grand Challenge-a Platform for End-to-end Development of Machine Learning Solutions in Biomedical Imaging https://grand-challenge.org/ Litjens, G. et al. 1399 h&e-stained sentinel lymph node sections of breast cancer patients: the camelyon dataset. , giy065 (2018). GigaScience 7 Menze, B. H. et al. The multimodal brain tumor image segmentation benchmark (brats). , 1993–2024 (2014). IEEE Trans. Med. Imaging 34 Bakas, S. et al. Identifying the best machine learning algorithms for brain tumor segmentation, progression assessment, and overall survival prediction in the brats challenge. (2018). arXiv preprint arXiv:1811.02629 Bakas, S. et al. Advancing the cancer genome atlas glioma MRI collections with expert segmentation labels and radiomic features. , 170117 (2017). Sci. Data 4 Simpson, A. L. et al. A large annotated medical image dataset for the development and evaluation of segmentation algorithms. (2019). arXiv preprint arXiv:1902.09063 Yeh, F.-C. et al. Quantifying differences and similarities in whole-brain white matter architecture using local connectome fingerprints. , e1005203 (2016). PLoS Comput. Biol. 12 Chang, K. et al. Distributed deep learning networks among institutions for medical imaging. , 945–954 (2018). J. Am. Med. Inform. Assoc. 25 Shokri, R., Stronati, M., Song, C. & Shmatikov, V. Membership inference attacks against machine learning models. In , 3-18 (IEEE, 2017). 2017 IEEE Symposium on Security and Privacy (SP) Sablayrolles, A., Douze, M., Ollivier, Y., Schmid, C. & Jégou, H. White-box vs black-box: Bayes optimal strategies for membership inference. In Chaudhuri, K. & Salakhutdinov, R. (eds) , 5558–5567. (PMLR, 2019). Proceedings of the 36th International Conference on Machine Learning, {ICML} 97 http://proceedings.mlr.press/v97/sablayrolles19a.html Zhang, C., Bengio, S., Hardt, M., Recht, B. & Vinyals, O. Understanding deep learning requires rethinking generalization. In , (OpenReview.net, 2017). 5th International Conference on Learning Representations, {ICLR}. https://openreview.net/forum?id=Sy8gdB9xx Carlini, N., Liu, C., Erlingsson, Ú., Kos, J. & Song, D. The secret sharer: evaluating and testing unintended memorization in neural networks. In Heninger, N. & Traynor, P. (eds) { } ({ } , 267–284. ({USENIX} Association, Santa Clara, CA, USA, 2019). 28th USENIX Security Symposium USENIX Security 19 https://www.usenix.org/conference/usenixsecurity19/presentation/carlini Abadi, M. et al. Deep learning with differential privacy. In , 308–318 (ACM, 2016). Proceedings of the 2016 ACM SIGSAC Conference on Computer and Communications Security Shokri, R. & Shmatikov, V. Privacy-preserving deep learning. In , 1310–1321 (ACM, 2015). Proceedings of the 22nd ACM SIGSAC conference on computer and communications security Langlotz, C. P. et al. A roadmap for foundational research on artificial intelligence in medical imaging: from the 2018 nih/rsna/acr/the academy workshop. , 781–791 (2019). Radiology 291 Kim, Y., Sun, J., Yu, H. & Jiang, X. Federated Tensor Factorization for Computational Phenotyping. In . 887–895. (ACM, Halifax, NS, Canada, 2017). Proceedings of the 23rd {ACM} {SIGKDD} International Conference on Knowledge Discoveryand Data Mining https://doi.org/10.1145/3097983.3098118 He, C., Annavaram, M. & Avestimehr, S. Fednas: Federated deep learning via neural architecture search. (2020). https://sites.google.com/view/cvpr20-nas/ Trustworthy federated data analytics (tfda). (2020) (Accessed 28 May 2020). https://tfda.hmsp.center/ Joint Imaging Platform (Jip). (2020) (Accessed 28 May 2020). https://jip.dktk.dkfz.de/jiphomepage/ Medical institutions collaborate to improve mammogram assessment ai. (2020) (Accessed 28 May 2020). https://blogs.nvidia.com/blog/2020/04/15/federated-learning-mammogram-assessment/ Healthchain consortium. (2020) (Accessed 28 May 2020). https://www.substra.ai/en/healthchain-project The federated tumor segmentation (fets) initiative. (2020) (Accessed 28 May 2020). https://www.fets.ai Machine learning ledger orchestration for drug discovery. (2020). Accessed 28 May 2020. https://cordis.europa.eu/project/id/831472 Konečny`, J., McMahan, H. B., Ramage, D. & Richtárik, P. Federated optimization: Distributed machine learning for on-device intelligence. (2016). arXiv preprint arXiv:1610.02527 Lalitha, A., Kilinc, O. C., Javidi, T. & Koushanfar, F. Peer-to-peer federated learning on graphs. (2019). arXiv preprint arXiv:1901.11173 Li, T., Sahu, A. K., Zaheer, M., Sanjabi, M., Talwalkar, A. & Smith, V. Federated optimization in heterogeneous networks. (2018). arXiv preprint arXiv:1812.06127 Zhao, Y. et al. Federated learning with non-iid data. (2018). arxivabs/1806.00582 Li, X., Huang, K., Yang, W., Wang, S. & Zhang, Z. On the convergence of fedavg on non-IID data. (2020). https://openreview.net/forum?id=HJxNAnVtDS Wu, B. et al. P3sgd: patient privacy preserving SGD for regularizing deep CNNs in pathological image classification. In (pp. 2099–2108) (2019). Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition Zhu, L., Liu, Z. & Han, S. Deep leakage from gradients. In Wallach, H. M. et al. (eds) , 14747–14756. (2019). Advances in Neural Information Processing Systems 32: Annual Conference on Neural Information Processing Systems http://papers.nips.cc/paper/9617-deep-leakage-from-gradients Wang, Z. et al. Beyond inferring class representatives: user-level privacy leakage from federated learning. In 2512–2520. (IEEE, Paris, France, 2019). 2019 {IEEE} Conferenceon Computer Communications, {INFOCOM} https://doi.org/10.1109/INFOCOM.2019.8737416 Hitaj, B., Ateniese, G. & Perez-Cruz, F. Deep models under the gan: information leakage from collaborative deep learning. In , CCS’17, 603–618 (Association for Computing Machinery, New York, NY, USA, 2017). Proceedings of the 2017 ACM SIGSAC Conference on Computer and Communications Security Ghorbani, A. & Zou, J. Data shapley: Equitable valuation of data for machine learning. In (pp. 2242-2251) (2019). International Conference on Machine Learning Признанија Оваа работа беше поддржана од страна на Центарот за истражување и иновации во Велика Британија за медицински слики и вештачка интелигенција на Центарот за вредност-базирана здравствена заштита, од Центарот за медицински инженеринг Wellcome/EPSRC (WT203148/Z/16/Z), од Флагманската програма Wellcome (WT213038/Z/18/Z), од Интрамуралната истражувачка програма на Националните институти за здравство (NIH) Клинички центар, од Националниот институт за рак на NIH под доделен број U01CA242871, од Националниот институт за невролошки нарушувања и мозочен удар на NIH под доделен број R01NS042645, како и од Хелмхолтз иницијативата и мрежниот фонд (проектот This paper is under CC by 4.0 Deed (Attribution 4.0 International) license. available on nature Овој документ е под лиценца CC by 4.0 Deed (Attribution 4.0 International). Достапни во природата