Nova privatnost-prva AI predviđa COVID ozbiljnost koristeći X-zrake i medicinske zapise

Autori : Ittai Dayan Holger R. Roth Aoxiao Zhong Ahmed Harouni Amilcare Gentili Anas Z. Abidin Andrew Liu Anthony Beardsworth Costa Bradford J. Wood Čije-Sung Tsai Chih-Hung Wang Čun-Nan Hsu C. K. Lee Peiying Ruan Daguang Xu Dufan Wu Eddie Huang Felipe Campos Kitamura Svijet Griffin Lacey Gustavo César de Antônio Corradi Gustavo Nino Hao-Hsin Shin Hirofumi Obinata Hui Ren Jason C. Crane Jesse Tetreault Jiahui Guan John W. Garrett Joshua D. Kaggie Jung Gil Park Keith Dreyer Krishna Juluru Kristopher Kersten Marcio Aloisio Bezerra Cavalcanti Rockenbach Marius George Linguraru Masoom A. Haider Meena AbdelMaseeh Nikola Rijeka Pablo F. Damasceno Pedro Mario Cruz e Silva Pochuan Wang Sheng Xu Shuichi Kawano Sira Sriswasdi Soo Young Park Thomas M. Grist Varun Buch Watsamon Jantarabenjakul Weichung Wang Won Young Tak Xiang Li Xihong Lin Young Joon Kwon Abood Quraini Andrew Feng Andrew N. Priest Baris Turkbey Benjamin Glicksberg Bernardo Bizzo Byung Seok Kim Carlos Tor-Díez Čia Čeng Lee Chia-Jung Hsu Chin Lin Chiu-Ling Lai Kristof P. Hess Colin Compas Deepeksha Bhatia Eric K. Oermann Evan Leibovitz Hisashi Sasaki Hitoshi Mori Isaac Yang Jae Ho Sohn Krishna Nand Keshava Murthy Li-Čen Fu Matheus Ribeiro Furtado de Mendonça Mike Fralick Min Kyu Kang Mohammad Adil Natalija Gangai Peerapon Vateekul Pierre Elnajjar Sarah Hickman Sharmila Majumdar Shelley L. McLeod Sheridan Reed Stefan Gräf Stephanie Harmon Tatsuya Kodama Sljedeći Članak Thanyawee Puthanakit Tony Mazzulli Vitor Lima de Lavor Yothin Rakvongthai Yu Rim Lee Yuhong Wen Fiona J. Gilbert Mona G. Flores Quanzheng Li Autori : Sljedeći Dayan Holger R. Roth Aoxiao Zhong Ahmed Harouni Amilcare Gentili Anas Z. Abidin Andrew Liu Anthony Beardsworth Costa Svijet Bradford J. Wood Čije-Sung Tsai Čih-Hung Wang Čun-Nan Hsu C. K. Li Sljedeći: Peiying Ruan Daguang Xu Dufan Wu Eddie Huang Felipe Campos Kitamura Svijet Griffin Lacey Gustavo César de Antônio Corradi Gustavo Nino Hao-Hsin Shin Hirofumi Obinata Sljedeći Ren Jason C. Krane Sljedeći članakJesse Tetreault Jiahui Guan John W. Garrett Joshua D. Kaggie Park Jung Gil Keith Dreyer Svijet Krishna Juluru Kristina Krstić Marcio Aloisio Bezerra Cavalcanti Rockenbach Marius George Linguraru Masoom A. Haider Meena AbdelMaseeh Nikola Rijeka Pablo F. Damasceno Pedro Mario Cruz i Silva Pochuan Wang Šeng Xu Šuichi Kawano Sira Srišavić Soo Young Park Thomas M. Grist Varun Knjiga Watsamon Jantarabenjakul Sljedeći Wang Mladić pobijedio Xiang Li Xihong Lin Mladi Joon Kwon Sljedeći članakQuraini Andrew Feng Andrew N. Priest Sljedeći članakTurkbey Benjamin Glicksberg Bernardo Bizzo Sljedeći Članak Seok Kim Carlos Tor-Díez Čia Čeng Lee Chia-Jung Hsu Čin Lin Sljedeći članak Chiu-Ling Lai Kristof P. Hess Kolin Kompas Deepeksha Bhatia Eric K. Oermann Evan Leibovitz Hisashi Sasaki Hitoshi Mori Isaac Yang Jae Ho Sohn Krishna Nand Keshava Murthy Li-Čen Fu Matheus Ribeiro Furtado de Mendonça Mike Fralick Min Kyu Kang Muhamed Adil Natalija Gangai Peerapon Vateekul Pierre Elnajjar Sarah Hickman Šarmila Majumdar Shelley L. McLeod Svijet Sheridan Reed Stefan Grof Stephanie Harmon Tatsuya Kodama Sljedeći Članak Thanyawee Puthanakit Tony Mazzulli Sljedeći članakVitor Lima de Trabor Sljedeći članakYothin Rakvongthai Yu Rim Lee Yuhong Wen Fiona J. Gilbert Mona G. Flores Svijet Li Abstrakcija Federated Learning Setup (FL) je metoda koja se koristi za obuku modela umjetne inteligencije s podacima iz više izvora, uz održavanje anonimnosti podataka, čime se uklanjaju mnoge prepreke za dijeljenje podataka. Ovdje smo koristili podatke iz 20 instituta diljem svijeta za obuku modela FL, nazvanog EXAM (elektronski medicinski zapis (EMR) prsni X-ray AI model), koji predviđa buduće potrebe kisika simptomatskih pacijenata s COVID-19 koristeći ulazne vitalne znakove, laboratorijske podatke i prsne X-zrake. EXAM je postigao prosječnu površinu pod krivulju (AUC) > 0,92 za predviđanje rezultata na 24 i 72 sata od trenutka početne prezentacije u hitnoj sobi, a pružao je 16% pobolj glavna Znanstvene, akademske, medicinske i podatkovne znanstvene zajednice okupile su se pred pandemijskom krizom COVID-19 kako bi brzo procijenile nove paradigme u umjetnoj inteligenciji (AI) koje su brze i sigurne, te potencijalno poticale dijeljenje podataka i modeliranje i testiranje bez uobičajenih prepreka za privatnost i vlasništvo podataka konvencionalne suradnje. , Pružatelji zdravstvene zaštite, istraživači i industrija usmjerili su svoj fokus na rješavanje nezadovoljenih i kritičnih kliničkih potreba koje je stvorila kriza, s iznimnim rezultatima. , , , , , , Naručivanje kliničkih ispitivanja ubrzalo je i olakšalo nacionalno regulatorno tijelo i međunarodni duh suradnje. , , Discipline analize podataka i umjetne inteligencije oduvijek su promicale otvorene i kolaborativne pristupe, uključujući koncepte kao što su softver otvorenog koda, reproducirajuće istraživanje, skladišta podataka i javno dostupnost anonimnih skupova podataka. , Pandemija je naglasila potrebu da se hitno provede suradnja podataka koja osnažuje kliničke i znanstvene zajednice u odgovoru na brzo evoluirajuće i široko rasprostranjene globalne izazove. , , . 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 Konkretni primjer tih vrsta suradnje je naš prethodni rad na modelu kliničke podrške odlučivanju (CDS) SARS-COV-2 koji se temelji na umjetnoj inteligenciji. Ovaj model CDS-a razvijen je u Mass General Brigham (MGB) i validiran je u više zdravstvenih sustava. ulazi u model CDS-a bili su slike X-zraka prsnog koša (CXR), vitalni znakovi, demografski podaci i laboratorijske vrijednosti koje su se pokazale u prethodnim publikacijama da predviđaju rezultate pacijenata s COVID-19 , , , CXR je odabran kao ulaz za slikanje jer je široko dostupan i općenito označen smjernicama kao što su one koje pruža ACR Društvo Fleischner , the WHO Nacionalna toračka društva Nacionalno ministarstvo zdravlja COVID priručnici i radiološka društva diljem svijeta Izlazak modela CDS bio je rezultat, nazvan CORISK , koja odgovara zahtjevima za potporu kisiku i koja bi mogla pomoći u ispitivanju pacijenata od strane frontline kliničara , , Poznato je da pružatelji zdravstvenih usluga preferiraju modele koji su validirani na vlastitim podacima. Do danas, većina modela AI-a, uključujući gore spomenuti model CDS-a, osposobljena je i validirana na "uzetim" podacima koji često nemaju raznolikost. , , što potencijalno rezultira prekomjernim prilagođavanjem i nižom generalizabilnošću.To se može ublažiti osposobljavanjem s različitim podacima s više lokacija bez centraliziranja podataka korištenje metoda kao što je transfer učenje , FL je metoda koja se koristi za obuku AI modela na različitim izvorima podataka, bez da se podaci prenose ili izlažu izvan njihove izvorne lokacije. . 18 19 20 21 22 23 24 25 26 27 28 29 30 27 31 32 33 34 35 36 Federirano učenje podržava brzo pokretanje centraliziranih eksperimenata uz poboljšanu sljedivost podataka i procjenu algoritamskih promjena i utjecaja Jedan od pristupa FL-u, koji se naziva klient-server, šalje “neobučeni” model na druge poslužitelje (”uzroci”) koji provode djelomične zadatke obuke, a rezultati se vraćaju kako bi se spojili u središnji (”federirani”) poslužitelj. . 37 36 Upravljanje podacima za FL održava se na lokalnoj razini, ublažavajući zabrinutosti o privatnosti, s samo modelskim težinama ili gradijentima koji se komuniciraju između klijenata i federiranih poslužitelja. , FL je već pokazao obećanje u nedavnim medicinskim aplikacijama za slikanje , , , Istraživanje o COVID-19 , , Primjetan primjer je model predviđanja smrtnosti kod pacijenata zaraženih SARS-COV-2 koji koristi kliničke značajke, iako ograničen u smislu broja modaliteta i razmjera. . 38 39 40 41 42 43 8 44 45 46 Naš je cilj bio razviti robustan, generalizabilan model koji bi mogao pomoći u testiranju pacijenata. Teorizirali smo da se model CDS može uspješno federirati, s obzirom na njegovu upotrebu ulaznih podataka koji su relativno uobičajeni u kliničkoj praksi i koji se ne oslanjaju uvelike na procjene ovisne o operatoru o stanju pacijenta (kao što su klinički dojmovi ili prijavljeni simptomi). Umjesto toga, korišteni su laboratorijski rezultati, vitalni znakovi, studija slike i uobičajeno zarobljeni demografski (tj. dob). Stoga smo prekvalificirali model CDS s raznovrsnim podacima koristeći pristup FL klijenta-servera kako bismo razvili novi globalni model FL, koji je nazvan EXAM, koristeći CXR i EM Naša je hipoteza bila da će EXAM raditi bolje od lokalnih modela i bolje generalizirati zdravstvene sustave. Rezultati Model arhitekture za ispit Model EXAM temelji se na modelu CDS navedenom gore Ukupno, 20 značajki (19 iz EMR-a i jedan CXR) upotrijebljeno je kao ulaz u model. Rezultat (tj. „zemljina istina“) oznaci dodijeljeni su na temelju pacijentove terapije kisikom nakon razdoblja od 24 i 72 sata od početnog prijema u odjel za hitne slučajeve (ED). . 27 1 Oznake rezultata pacijenata postavljene su na 0, 0,25, 0,50 i 0,75 ovisno o najintenzivnijoj terapiji kisikom koju je pacijent primio u prozoru predviđanja. Kategorije terapije kisikom bile su, odnosno, sobni zrak (RA), kisik s niskim protokom (LFO), kisik s visokim protokom (HFO)/neinvazivna ventilacija (NIV) ili mehanička ventilacija (MV). Ako je pacijent umro unutar prozora predviđanja, oznaka rezultata postavljena je na 1. Za funkcije EMR-a korištene su samo prve vrijednosti snimljene u ED-u, a predobrada podataka uključivala je deidentifikaciju, imputaciju manjkajućih vrijednosti i normalizaciju na nulu sredinu i varijancu jedinica. Model stoga spaja informacije iz funkcija EMR i CXR, koristeći 34-slojnu konvolucijsku neuronsku mrežu (ResNet34) kako bi izvukao značajke iz CXR-a i Deep & Cross mreže kako bi spojio značajke zajedno s funkcijama EMR-a (za više detalja, vidjeti Rezultat modela je ocjena rizika, nazvana ocjena EXAM, koja je kontinuirana vrijednost u rasponu od 0 do 1 za svaku od 24- i 72-satnih predviđanja koja odgovaraju gore opisanim oznakama. Metode Federiranje modela EXAM model je osposobljen koristeći kohortu od 16.148 slučajeva, čineći ga ne samo među prvim FL modelima za COVID-19 već i vrlo velikim i multi-kontinentalnim razvojnim projektom u klinički relevantnoj AI (Slika. Podaci između lokacija nisu bili usklađeni prije ekstrakcije i, s obzirom na realne kliničke informatike okolnosti, meticulo usklađivanje unosa podataka nije provedeno od strane autora (Slika. ). 1a, b 1C i D , Svjetska karta koja prikazuje 20 različitih klijenata koje su doprinijele studiji EXAM. , Broj slučajeva koje je pridonijela svaka institucija ili mjesto (klijenti 1 predstavljaju mjesto koje je pridonijelo najveći broj slučajeva). , Grudi X-ray intenzitet raspodjele na svakom mjestu klijenta. , Age of patients at each client site, showing minimum and maximum ages (asterisks), mean age (triangles) and standard deviation (horizontal bars). The number of samples of each client site is shown in Supplementary Table . a b c d 1 Usporedba lokalno osposobljenih modela s globalnim FL modelom na testnim podacima svakog klijenta. « 1 × 10–3, Wilcoxon potpisani test) od 16% (kao što je definirano prosječnom AUC-om prilikom pokretanja modela na odgovarajućim lokalnim testnim skupovima: od 0,795 do 0,920, ili 12,5 postotnih bodova) (Slika. Također je rezultiralo 38% poboljšanjem općenitosti (kao što je definirano prosječnom AUC-om prilikom pokretanja modela na svim testnim skupinama: od 0,667 do 0,920, ili 25,3 postotnih bodova) najboljeg globalnog modela za predviđanje 24-satne obrade kisikom u usporedbi s modelima obučene samo na vlastitim podacima lokacije (Slika. Za rezultate predviđanja 72 sata tretmana kisikom, najbolje globalno modelsko osposobljavanje rezultiralo je prosječnim poboljšanjem performansi od 18% u usporedbi s lokalno osposobljenim modelima, dok se općenitost globalnog modela poboljšala u prosjeku za 34% (Extended Data Fig. Stabilnost naših rezultata potvrđena je ponavljanjem tri puta lokalnog i FL treninga na različitim randomiziranim podjelama podataka. P 2a 2B 1 , Učinak na testu svakog klijenta postavljen je u predviđanju 24-satne obrade kisika za modele obučene samo na lokalnim podacima (Local) u usporedbi s najboljim globalnim modelom koji je dostupan na poslužitelju (FL (vidi najbolje). , Generalizabilnost (prosječna učinkovitost na testnim podacima drugih lokacija, kao što je prosječna AUC) kao funkcija veličine skupova podataka klijenta (bez slučajeva). Zelena horizontalna linija označava učinkovitost generalizabilnosti najboljeg globalnog modela. ) i klijenti 14 imali su slučajeve samo s liječenjem RA, tako da se mjerilo procjene (AUC) nije primjenjivalo u bilo kojem od tih slučajeva ( Podaci za klijenta 14 također su isključeni iz izračuna prosječne generalizabilnosti u lokalnim modelima. a b 1 Metode Lokalni modeli koji su trenirani pomoću neuravnoteženih kohort (na primjer, uglavnom blagi slučajevi COVID-19) značajno su koristili od FL pristupa, s značajnim poboljšanjem u predviđanju prosječne AUC performanse za kategorije s samo nekoliko slučajeva. To je bilo očito na klijenta mjestu 16 (neuravnotežen skup podataka), s većinom pacijenata koji doživljavaju blagu ozbiljnost bolesti i s samo nekoliko teških slučajeva. i proširenih podataka Fig. Što je još važnije, generalizabilnost FL modela znatno je povećana u odnosu na lokalno obučeni model. 3a 2 , ROC na lokaciji klijenta 16, s neuravnoteženim podacima i uglavnom blagim slučajevima. , ROC lokalnog modela na lokaciji klijenta 12 (mali skup podataka), prosječni ROC modela obučene na većim skupovima podataka koji odgovaraju pet klijenata lokacija u području Bostona (1, 4, 5, 6, 8) i ROC najboljeg globalnog modela u predviđanju tretmana kisikom 72 h za različite pragove rezultata EXAM (lijevo, srednje, desno). prosječni ROC izračunava se na temelju pet lokalno obučene modela, dok sivo područje označava standardno odstupanje ROC. ROCs za tri različite vrijednosti rezanja ( ) of the EXAM risk score are shown. Pos and neg denote the number of positive and negative cases, respectively, as defined by this range of EXAM score. a b t U slučaju klijenata s relativno malim skupovima podataka, najbolji FL model znatno je nadmašio ne samo lokalni model, već i one obučene na većim skupovima podataka s pet klijenata lokacija u području Bostona u SAD-u (Slik. ). 3B Globalni model bio je dobar u predviđanju potreba za kisikom u 24/72 sati kod pacijenata s COVID pozitivnim i negativnim (Extended Data Fig. ). 3 Validacija na neovisnim mjestima Following initial training, EXAM was subsequently tested at three independent validation sites: Cooley Dickinson Hospital (CDH), Martha’s Vineyard Hospital (MVH) and Nantucket Cottage Hospital (NCH), all in Massachusetts, USA. The model was not retrained at these sites and it was used only for validation purposes. The cohort size and model inference results are summarized in Table , a ROC krivulje i matice zbunjenosti za najveći skup podataka (od CDH) prikazane su na slici. Operativna točka postavljena je kako bi se razlikovalo liječenje (ili smrt) između nemehaničke ventilacije i mehaničke ventilacije (MV). FL globalni model osposobljen, EXAM, postigao je prosječnu AUC od 0,944 i 0,924 za zadatke predviđanja 24 i 72 sata, odnosno (Tabela). Za predviđanje MV liječenja (ili smrti) u 24 h, EXAM je postigao osjetljivost od 0,950 i specifičnost od 0,882 na CDH, i osjetljivost od 1.000 specifičnost od 0,934 na MVH. NCH nije imao nikakvih slučajeva s MV/smrt u 24 h. U odnosu na 72-h MV predviđanje, EXAM je postigao osjetljivost od 0,929 i specifičnost od 0,880 na CDH, osjetljivost od 1.000 i specifičnost od 0,976 na MVH i osjetljivost od 1.000 i specifičnost od 0,929 na NCH. 2 4 2 , , Performance (ROC) (top) i confusion matrice (bottom) EXAM FL modela na CDH podatkovnom skupu za predviđanje zahtjeva kisika u 24 h ( (u razdoblju od 24 sata) ). ROCs for three different cutoff values ( (c) prikazan je rezultat ispitivanja rizika. a b a b t Za MV na CDH u 72 h, EXAM je imao nisku lažno negativnu stopu od 7,1%. , prikazujući dva lažno-negativna slučaja iz CDH-a gdje je jedan slučaj imao mnogo nedostajućih značajki podataka EMR-a, a drugi je imao CXR s pokretnim artefaktom i nekim nedostajućim značajkama EMR-a. 4 Use of differential privacy A primary motivation for healthcare institutes to use FL is to preserve the security and privacy of their data, as well as adherence to data compliance measures. For FL, there remains the potential risk of model ‘inversion’ ili čak rekonstrukciju obrazaca treninga iz samih gradijenata modela Kako bi se suprotstavili tim rizicima, mjere za poboljšanje sigurnosti korištene su za ublažavanje rizika u slučaju "presretanja" podataka tijekom komunikacije između web-mjesta i poslužitelja. Eksperimentirali smo s tehnikama za izbjegavanje presretanja podataka FL-a i dodali sigurnosnu značajku za koju vjerujemo da bi mogla potaknuti više institucija da koriste FL. . Through investigation of a partial weight-sharing scheme , , , pokazali smo da modeli mogu postići usporedive performanse čak i kada se dijeli samo 25% ažuriranja težine (Extended Data Fig. ). 47 48 49 50 50 51 52 5 rasprava Ova studija sadrži veliku, realnu studiju o zdravstvenoj skrbi FL u smislu broja lokacija i broja podatkovnih točaka koji se koriste. Vjerujemo da pruža snažan dokaz-of-koncepta izvedivosti korištenja FL za brzi i kolaborativni razvoj potrebnih modela AI u zdravstvenoj skrbi. Naša studija uključuje više lokacija na četiri kontinenta i pod nadzorom različitih regulatornih tijela, i tako drži obećanje da će se pružiti različitim reguliranim tržištima na ubrzan način. Globalni FL model, EXAM, pokazao se snažnijim i postigao bolje rezultate na pojedinačnim lokacijama nego bilo koji model obučeni na samo lokalnim podacima. Vjerujemo da je dosljedno poboljšanje postignuto zbog većeg, ali i raznolikijeg, skupu podataka, korištenje Za klijenta s relativno malim skupom podataka, dva tipična pristupa mogla bi se upotrijebiti za usklađivanje korisnog modela: jedan je treniranje na lokalnoj razini s vlastitim podacima, a drugi je primjena modela osposobljenog na većem skupu podataka. Za web-mjesta s malim skupovima podataka, bilo bi praktički nemoguće izgraditi učinkovit model dubokog učenja koristeći samo njihove lokalne podatke. Otkriće, da su ta dva pristupa nadmašila na sva tri predviđanja modela globalnog FL-a, ukazuje na to da je korist za web-mjesta klijenata s malim skupinama podataka koji proizlaze iz sudjelovanja u FL-ovim suradnjama značajna. To je vjerojatno odraz FL-ove sposobnosti da sakrije više raznolikosti od . 46 Rezultati validiranja potvrdili su da je globalni model robustan, podupirući našu hipotezu da su FL-trenirani modeli generalizabilni u svim zdravstvenim sustavima. Oni pružaju uvjerljiv slučaj za korištenje prediktivnih algoritama u skrbi za pacijente COVID-19 i upotrebu FL-a u stvaranju modela i testiranju. Sudjelovanjem u ovoj studiji klijenti su primili pristup EXAM-u, kako bi bili dodatno validirani prije traženja bilo kakvog regulatornog odobrenja ili budućeg uvođenja u kliničku skrb. , kao i na različitim lokacijama koje nisu bile dio obuke EXAM-a. 53 Over 200 prediction models to support decision-making in patients with COVID-19 have been published . Unlike the majority of publications focused on diagnosis of COVID-19 or prediction of mortality, we predicted oxygen requirements that have implications for patient management. We also used cases with unknown SARS-COV-2 status, and so the model could provide input to the physician ahead of receiving a result for PCR with reverse transcription (RT–PCR), making it useful for a real-life clinical setting. The model’s imaging input is used in common practice, in contrast with models that use chest computed tomography, a nonconsensual diagnostic modality. The model’s design was constrained to objective predictors, unlike many published studies that leveraged subjective clinical impressions. The data collected reflect varied incidence rates, and thus the ‘population momentum’ we encountered is more diverse. This implies that the algorithm can be useful in populations with different incidence rates. 19 Identifikacija kohort pacijenata i usklađivanje podataka nisu nova pitanja u istraživanju i znanosti o podacima Potrebna su poboljšanja u kliničkim informacijskim sustavima kako bi se racionalizirala priprema podataka, što dovodi do boljeg iskorištavanja mreže web-mjesta koje sudjeluju u FL-u. Sustav koji bi omogućio besprijekorno zaključivanje modela i obradu rezultata u blisko-realnom vremenu također bi bio koristan i "zatvorio bi krug" od obuke do implementacije modela. 54 39 Budući da podaci nisu bili centralizirani, oni nisu lako dostupni. s obzirom na to, svaka buduća analiza rezultata, izvan onoga što je izvedeno i prikupljeno, je ograničena. Slično drugim modelima strojnog učenja, EXAM je ograničen kvalitetom podataka o obuci. Institucije zainteresirane za uvođenje ovog algoritma za kliničku njegu trebaju razumjeti potencijalne predrasude u obuci. Na primjer, oznake koje se koriste kao temeljna istina u obuci modela EXAM proizlaze iz 24- i 72-satne potrošnje kisika kod pacijenta; pretpostavlja se da kisik koji se isporučuje pacijentu odgovara potrebama za kisikom. Međutim, u ranoj fazi COVID-19 pandemije, mnogim pacijentima je propisano visok protok kisika profilaktički bez obzira na njihovu potrebu za kisikom. Takva klinička praksa mogla bi iskriviti predviđanja koja je napravio ovaj model. Budući da je pristup našim podacima bio ograničen, nismo imali dovoljno dostupnih informacija za generiranje detaljne statistike o uzrocima neuspjeha, post hoc, na većini lokacija. međutim, proučavali smo slučajeve neuspjeha s najvećeg neovisnog testnog mjesta, CDH, i uspjeli smo generirati hipoteze koje možemo testirati u budućnosti. U budućnosti namjeravamo istražiti i potencijal za "populacijski drift" zbog različitih faza progresije bolesti. Jedna od značajki koje bi ojačale ove vrste suradnje na velikoj razini je sposobnost predviđanja doprinosa svake stranice klijenta prema poboljšanju globalnog modela FL. To će pomoći u odabiru lokacije klijenta i u prioritetiranju napora za prikupljanje podataka i anotaciju. Ovo je posebno važno s obzirom na visoke troškove i tešku logistiku tih velikih konzorcijskih napora, i omogućit će tim naporima da uhvate raznolikost, a ne čistu količinu uzoraka podataka. Budući pristupi mogu uključiti automatizirano pretraživanje hiperparametra Neuralna arhitektura pretraživanja i drugo automatizirano strojno učenje pristupi za učinkovitije pronalaženje optimalnih parametara obuke za svaku stranicu klijenta. 55 56 57 Known issues of batch normalization (BN) in FL motivirao nas da popravimo naš osnovni model za ekstrakciju značajki slike to reduce the divergence between unbalanced client sites. Future work might explore different types of normalization techniques to allow the training of AI models in FL more effectively when client data are nonindependent and identically distributed. 58 49 Recent works on privacy attacks within the FL setting have raised concerns on data leakage during model training U međuvremenu, algoritmi zaštite ostaju neistraženi i ograničeni višestrukim čimbenicima. , , pokazuju dobru zaštitu, mogu oslabiti performanse modela. algoritmi šifriranja, kao što je homomorfno šifriranje Kvantitativni način mjerenja privatnosti omogućio bi bolje izbore za odlučivanje o minimalnim parametrima privatnosti potrebnim uz održavanje klinički prihvatljivih performansi , , . 59 36 48 49 60 36 48 49 Following further validation, we envision deployment of the EXAM model in the ED setting as a way to evaluate risk at both the per-patient and population level, and to provide clinicians with an additional reference point when making the frequently difficult task of triaging patients. We also envision using the model as a more sensitive population-level metric to help balance resources between regions, hospitals and departments. Our hope is that similar FL efforts can break the data silos and allow for faster development of much-needed AI models in the near future. Metode Ethics approval Sve postupke obaviještenog Centra za zdravlje u Kaliforniji provedeno je u skladu s načelima za ljudsko eksperimentiranje, kako je definirano u Deklaraciji iz Helsinkija i Međunarodnoj konferenciji o usklađivanju dobre kliničke prakse, te su odobreni od strane relevantnih institucijskih odbora za preispitivanje na sljedećim lokacijama za validaciju: CDH, MVH, NCH i na sljedećim lokacijama za obuku: MGB, General Hospital (MGH), Brigham and Women’s Hospital, Newton-Wellesley Hospital, San Shore Public Medical Center i New Faulkner Hospital (sve osam tih bolnica obuhvaćeno je odobrenjem odobrenja od MGB-a, MVH, NCH, 2020P002673 i informiranog odobrenja odobrenja od Slijedile su se smjernice MI-CLAIM-a za izvješćivanje o kliničkim modelima umjetne inteligencije (dodatna napomena) ) 2 Proučavanje postavljanja Istraživanje je uključivalo podatke iz 20 institucija (Fig. ): MGB, MGH, Brigham and Women’s Hospital, Newton-Wellesley Hospital, North Shore Medical Center and Faulkner Hospital; Children’s National Hospital in Washington, DC; NIHR Cambridge Biomedical Research Centre; The Self-Defense Forces Central Hospital in Tokyo; National Taiwan University MeDA Lab and MAHC and Taiwan National Health Insurance Administration; Tri-Service General Hospital in Taiwan; Kyungpook National University Hospital in South Korea; Faculty of Medicine, Chulalongkorn University in Thailand; Diagnosticos da America SA in Brazil; University of California, San Francisco; VA San Diego; University of Toronto; National Institutes of Health in Bethesda, Maryland; University of Wisconsin-Madison School of Medicine and Public Health; Memorial Sloan Kettering Cancer Center in New York; and Mount Sinai Health System in New York. Institutions were recruited between March and May 2020. Dataset curation started in June 2020 and the final data cohort was added in September 2020. Between August and October 2020, 140 independent FL runs were conducted to develop the EXAM model and, by the end of October 2020, EXAM was made public on NVIDIA NGC , , Podaci iz tri neovisne lokacije korišteni su za neovisnu validaciju: CDH, MVH i NCH, sve u Massachusettsu, SAD. Te tri bolnice imale su karakteristike populacije pacijenata različite od lokacija za obuku. 1a 61 62 63 Prikupljanje podataka Na 20 lokacija klijenata pripremljeno je ukupno 16.148 slučajeva (i pozitivnih i negativnih) u svrhu osposobljavanja, validacije i testiranja modela. Na stranicama klijenata nastojali su uključiti sve COVID-pozitivne slučajeve od početka pandemije u prosincu 2019. i do trenutka kada su započeli lokalno osposobljavanje za studiju EXAM. Sve lokalne obuke započele su do 30. rujna 2020. Na stranicama su također uključeni drugi pacijenti u istom razdoblju s negativnim rezultatima RT-PCR testa. Budući da je većina stranica imala više SARS-COV-2-negativnih nego -pozitivnih pacijenata, ograničili smo broj uključenih negativnih pacijenata na najviše 95 % ukupnih slučajeva na svakoj stranci. 1B Jedan "primjer" uključivao je CXR i potrebne ulazne podatke dobivene iz pacijentove medicinske evidencije. Distribucija i obrasci CXR intenziteta slike (vrijednosti piksela) uvelike su varirali među lokacijama zbog mnoštva čimbenika specifičnih za pacijenta i lokaciju, kao što su različiti proizvođači uređaja i protokoli za slikanje, kako je prikazano na slici. Starost pacijenata i raspodjela EMR-a znatno su varirali među lokacijama, kao što se očekivalo zbog različitih demografskih podataka među globalno rasprostranjenim bolnicama (Extended Data Fig. ) i 1B 1C i D 6 Patient inclusion criteria Kriteriji za uključivanje pacijenta bili su: (1) pacijent je predstavljen bolničkom ED-u ili jednakovrijednom; (2) pacijent je imao RT-PCR test obavljen u bilo kojem trenutku između predstavljanja ED-u i izbacivanja iz bolnice; (3) pacijent je imao CXR u ED-u; i (4) pacijentova evidencija imala je najmanje pet vrijednosti EMR-a detaljnih u Tablici. , all obtained in the ED, and the relevant outcomes captured during hospitalization. Of note, The CXR, laboratory results and vitals used were the first available for capture during the visit to the ED. The model did not incorporate any CXR, laboratory results or vitals acquired after leaving the ED. 1 Model ulaza Rezultati (tj. temeljna istina) označavanja dodijeljeni su na temelju zahtjeva pacijenata nakon razdoblja od 24 i 72 sata od početnog prijema u ED. . 1 Distribucija tretmana kisikom pomoću različitih uređaja na različitim lokacijama klijenta prikazana je u proširenom podatku. Razlika u raspodjeli skupova podataka između najvećih i najmanjih web-mjesta klijenata može se vidjeti u Extended Data Fig. . 7 8 Broj pozitivnih slučajeva COVID-19, kao što je potvrđeno pojedinačnim RT-PCR testom dobivenim u bilo kojem trenutku između predstavljanja ED-u i otpuštanja iz bolnice, naveden je u Dodatnoj tablici. Svaka klijenta je zatražena da slučajno podijeli svoj skup podataka u tri dijela: 70% za obuku, 10% za validaciju i 20% za testiranje. 1 Ispit za razvoj modela Postoje velike varijacije u kliničkom tijeku pacijenata koji su hospitalizirani s simptomima COVID-19, a neki doživljavaju brzo pogoršanje funkcije disanja koje zahtijevaju različite intervencije kako bi spriječili ili ublažili hipoksemiju. , Ključna odluka donesena tijekom procjene pacijenta na početnoj točki skrbi ili u ED-u je hoće li pacijent vjerojatno zahtijevati invazivnije ili ograničene mjere ili intervencije (kao što su MV ili monoklonalna antitijela) i treba li stoga primiti rijetku, ali učinkovitu terapiju, terapiju s uskim omjerom rizika i koristi zbog nuspojava ili višu razinu skrbi, kao što je prijem u jedinicu intenzivne njege. U suprotnom, pacijent koji je na manjem riziku od zahtijevanja invazivne terapije kisikom može biti smješten u manje intenzivnu opremu, kao što je redovita odjel, ili čak pušten iz ED-a za nastavak samokontrole kod kuće. EXAM je razvijen kako bi pomogao pri razvrstavanju takvih pacijenata. 62 63 64 65 U ovom trenutku model nije odobren od strane bilo koje regulatorne agencije i treba ga koristiti samo u istraživačke svrhe. Ispitni rezultat EXAM je osposobljen pomoću FL-a; iz njega proizlazi rezultat rizika (tematski rezultat EXAM) sličan CORISK-u (Extended Data Fig. To odgovara zahtjevima pacijenta za potporu kisiku unutar dva prozora – 24 i 72 sata – nakon početne prezentacije ED-u. ilustrira kako se CORISK i ispitni rezultat mogu koristiti za razvrstavanje pacijenata. 27 9a 9b Prsne X-ray slike su prethodno obrađene kako bi odabrale prednju sliku položaja i isključile bočne slike, a zatim su razmjerene na rezoluciju od 224 × 224. , model spaja informacije iz funkcija EMR i CXR (na temelju modificiranog ResNet34 s prostornom pažnjom pretrenirano na CheXpert dataset) Mreža Deep & Cross Da bi se zbližili ti različiti tipovi podataka, 512-dimenzionalni vektor značajke izvađen je iz svake CXR slike koristeći pretreniranu ResNet34 s prostornom pažnjom, a zatim konkateniran s EMR značajkama kao ulazom za Deep & Cross mrežu. Koristili smo križnu entropiju kao funkciju gubitka i "Adam" kao optimizator. Sljedeći članakNVidia Clara Train SDK Prosječna AUC za zadatke razvrstavanja (≥LFO, ≥HFO/NIV ili ≥MV) izračunata je i upotrijebljena kao konačna metrika evaluacije, uz normalizaciju na nulu prosjeka i varijancu jedinica. ) i 9a 66 67 68 9b 69 70 27 Imputiranje i normalizacija Sljedeći članakMissForest algoritam Koristio se za imputiranje funkcija EMR, na temelju lokalnog skupa podataka o osposobljavanju. Ako je funkcija EMR potpuno nedostajala u skupu podataka o klijentima, koristila se prosječna vrijednost te funkcije, izračunata isključivo na podacima sa MGB klijenata. 71 Detalji spajanja podataka EMR-CXR pomoću Deep & Cross mreže Za modeliranje interakcija funkcija iz EMR i CXR podataka na razini slučaja korištena je shema dubokih značajki na temelju Deep & Cross mrežne arhitekture. Binarne i kategorijske značajke za EMR ulaze, kao i 512-dimenzionalne značajke slike u CXR-u, pretvorene su u spajane guste vektore stvarnih vrijednosti ugrađivanjem i skupljanjem slojeva. Transformirani gusti vektori služili su kao ulaz u okvir za spajanje, koji je posebno koristio križanje mreže kako bi izvršio spajanje među ulazima iz različitih izvora. Križanje mreža izvršilo je eksplicitno križanje značajki unutar svojih slojeva, provodeći unutarnje proizvode između izvorne ulazne značajke i izlaza iz prethodnog sloja, čime se povećava stupanj interakcije između značajki. U isto vrijeme, obučene su dvije pojedinačne klasične duboke nevronske mreže s nekoliko slojeva 68 FL details Pretpostavlja se da je najuspješniji oblik FL-a provedba federiranog prosječnog algoritma, kako je predložio McMahan et al. Ovaj algoritam može se realizirati pomoću postavljanja klijenta-servera gdje svaka stranka djeluje kao klijent. Može se misliti o FL-u kao metodi usmjerenoj na smanjenje globalne funkcije gubitka smanjenjem skupa lokalnih funkcija gubitka, koje se procjenjuju na svakoj lokaciji. Minimiziranjem lokalnog gubitka svakog klijenta, a također sinhroniziranjem naučene težine klijenta na centraliziranom agregatnom poslužitelju, može se minimizirati globalni gubitak bez potrebe za pristupom cijelom skupu podataka na centraliziranom mjestu. Svaka klijenta stranica uči lokalno i dijeli ažuriranja težine modela s središnjim poslužiteljem koji agregira doprinose koristeći sigurne slojeve slojeva socket šifriranja i ). 72 9c Pseudoalgoritam FL-a prikazan je u Dodatnoj napomeni U našim eksperimentima, postavili smo broj federiranih krugova na = 200, s jednom lokalnom fazom treninga po krugu za svakog klijenta. broj klijenata, , bio je do 20 ovisno o mrežnoj povezivosti klijenata ili dostupnim podacima za određeno ciljano razdoblje rezultata (24 ili 72 sata). , ovisi o veličini skupova podataka kod svakog klijenta i koristi se za ponderiranje doprinosa svakog klijenta prilikom agregiranja težina modela u federacijskom prosjeku. Tijekom zadatka FL obuke, svaka klijenta stranica odabire svoj najbolji lokalni model praćenjem performansi modela na svom lokalnom skupu validacije. Istodobno, poslužitelj određuje najbolji globalni model na temelju prosječnih rezultata validacije poslanih od svake klijenta stranice na poslužitelja nakon svakog FL kruga. Nakon završetka obuke FL, najbolji lokalni modeli i najbolji globalni model automatski se dijele sa svim klijentima lokacijama i ocjenjuju na lokalnim testnim podacima. 1 T t K NK k Adam optimizator je korišten za lokalno osposobljavanje i FL s početnom stopom učenja od 5 × 10–5 i postupnim raspadom stope učenja s faktorom 0,5 nakon svakih 40 epoha, što je važno za konvergenciju federiranih prosjeka. Slučajne afinne transformacije, uključujući rotaciju, prijevode, rezanje, skaliranje i slučajni intenzitet buke i pomicanja, primijenjene su na slike za povećanje podataka tijekom treninga. 73 Zbog osjetljivosti BN slojeva Kada smo se bavili različitim klijentima u neovisnom i identično raspodijeljenom okruženju, otkrili smo da se najbolje performanse modela događaju kada se pretrenirani ResNet34 drži s prostornom pažnjom. Deep & Cross mreža koja kombinira značajke slike s EMR značajkama ne sadrži BN slojeve i stoga nije bila pogođena problemima BN nestabilnosti. 58 47 U ovoj smo studiji istražili shemu za očuvanje privatnosti koja dijeli samo djelomične ažuriranja modela između poslužitelja i klijenata. ažuriranja težine razvrstana su tijekom svake iteracije po veličini doprinosa, a samo je određeni postotak najvećih ažuriranja težine podijeljen s poslužiteljem. (Extended Data Fig. ), koji je izračunan od svih gradijenata koji nisu nula, Δ To može biti drugačije za svakog klijenta. in each FL round Varijacije ove sheme mogle bi uključivati dodatno rezanje velikih gradijenata ili diferencijalnih shema privatnosti. koji dodaju slučajnu buku gradijentima ili čak sirovim podacima prije ulaska u mrežu . k 5 Sljedeći članak(t) k t 49 51 Statistička analiza We conducted a Wilcoxon signed-rank test to confirm the significance of the observed improvement in performance between the locally trained model and the FL model for the 24- and 72-h time points (Fig. i proširenih podataka Fig. Nulna hipoteza odbijena je jednostrano. « 1 × 10–3 u oba slučaja. 2 1 P Pearson’s correlation was used to assess the generalizability (robustness of the average AUC value to other client sites’ test data) of locally trained models in relation to respective local dataset size. Only a moderate correlation was observed ( = 0,43 milijuna = 0,035, stupnjevi slobode (df) = 17 za 24-satni model i 0 0 62 = 0.003, df = 16 for the 72-h model). This indicates that dataset size alone is not the only factor determining a model’s robustness to unseen data. r P r P Za usporedbu ROC krivulja iz globalnog FL modela i lokalnih modela osposobljenih na različitim mjestima (Extended Data Fig. ), smo pokrenuli 1000 uzoraka iz podataka i izračunali rezultirajuće AUC. Zatim smo izračunali razliku između dvije serije i standardizirali pomoću formule AUC1 – AUC2 – AUC2 – AUC2 – AUC2 Gdje je To je standardizirana razlika. je standardno odstupanje bootstrap razlika i AUC1 i AUC2 su odgovarajuće bootstrapped AUC serije. Uz normalnu raspodjelu, dobivamo values illustrated in Supplementary Table Rezultati pokazuju da je nulta hipoteza odbijena s vrlo niskim vrijednosti, što ukazuje na statističku značajnost superiornosti rezultata FL. vrijednosti je provedeno u R s pROC knjižnice . 3 D s D s D P 2 P P 74 Budući da model predviđa diskretni rezultat, kontinuirani rezultat od 0 do 1, jednostavna evaluacija kalibracije kao što je qqplot nije moguća. Proveli smo jednosmjernu analizu varijacije (ANOVA) testove za usporedbu rezultata lokalnih i FL modela između četiri kategorije temeljne istine (RA, LFO, HFO, MV). -statistička, izračunata kao varijacija između uzorka znači podijeljena s varijacijom unutar uzoraka i predstavlja stupanj disperzije između različitih skupina, korišten je za kvantificiranje modela. -vrijednosti pet različitih lokalnih mjesta su 245.7, 253.4, 342.3, 389.8 i 634.8, dok je vrijednost FL modela 843.5. -vrijednosti znače da su skupine više razdvojive, rezultati iz našeg FL modela jasno pokazuju veću disperziju između četiri kategorije temeljne istine. vrijednost ANOVA testa na modelu FL je <2 × 10–16, što ukazuje na to da su rezultati predviđanja FL statistički značajno različiti među različitim razredima predviđanja. 10 F F F P Izvješće sažetak Dodatne informacije o istraživanju dostupne su u Povezano s ovim člankom. Izvješće o istraživanju prirode Dostupnost podataka Sastav podataka od 20 instituta koji su sudjelovali u ovoj studiji ostaje pod njihovom skrbništvom. Ovi podaci korišteni su za obuku na svakoj od lokalnih lokacija i nisu bili podijeljeni s bilo kojom od drugih institucija koje sudjeluju ili s federiranim poslužiteljem, a oni nisu javno dostupni. Podaci s neovisnih validirajućih lokacija održava CAMCA, a pristup se može zatražiti kontaktiranjem Q.L. Na temelju odluke CAMCA-e, pregled dijeljenja podataka i izmjena IRB-a za istraživačke svrhe može provesti MGB istraživačka uprava i u skladu s MGB IRB i politikom. Dostupnost koda Svi kodovi i softver koji se koriste u ovoj studiji javno su dostupni na NGC-u. Da biste pristupili, prijavili se kao gost ili kreirali profil, unesite jedan od URL-ova ispod. Obučeni modeli, smjernice za pripremu podataka, kodovi za obuku, provjera validiranja modela, datoteka Readme, upute za instalaciju i datoteke za licenciranje javno su dostupni na NVIDIA NGC-u : u Federirani softver za učenje dostupan je kao dio Clara Train SDK: Alternativno, koristite ovu naredbu za preuzimanje modela "wget --content-disposition" -O clara_train_covid19_exam_ehr_xray_1.zip”. 61 https://ngc.nvidia.com/catalog/models/nvidia:med:clara_train_covid19_exam_ehr_xray https://ngc.nvidia.com/catalog/containers/nvidia:clara-train-sdk https://api.ngc.nvidia.com/v2/models/nvidia/med/clara_train_covid19_exam_ehr_xray/versions/1/zip References Budd, J. et al. Digital technologies in the public-health response to COVID-19. , 1183–1192 (2020). Nat. Med. 26 Moorthy, V., Henao Restrepo, A. M., Preziosi, M.-P. & Swaminathan, S. Data sharing for novel coronavirus (COVID-19). , 150 (2020). Bull. World Health Organ. 98 Chen, Q., Allot, A. & Lu, Z. Keep up with the latest coronavirus research. , 193 (2020). Nature 579 Fabbri, F., Bhatia, A., Mayer, A., Schlotter, B. & Kaiser, J. BCG IT spend pulse: how COVID-19 is shifting tech priorities. (2020). https://www.bcg.com/publications/2020/how-covid-19-is-shifting-big-it-spend Candelon, F., Reichert, T., Duranton, S., di Carlo, R. C. & De Bondt, M. The rise of the AI-powered company in the postcrisis world. (2020). https://www.bcg.com/en-gb/publications/2020/business-applications-artificial-intelligence-post-covid Chao, H. et al. Integrative analysis for COVID-19 patient outcome prediction. , 101844 (2021). Med. Image Anal. 67 Zhu, X. et al. Joint prediction and time estimation of COVID-19 developing severe symptoms using chest CT scan. , 101824 (2021). Med. Image Anal. 67 Yang, D. et al. Federated semi-supervised learning for Covid region segmentation in chest ct using multi-national data from China, Italy, Japan. , 101992 (2021). Med. Image Anal. 70 Minaee, S., Kafieh, R., Sonka, M., Yazdani, S. & Jamalipour Soufi, G. Deep-COVID: predicting COVID-19 from chest X-ray images using deep transfer learning. , 101794 (2020). Med. Image Anal. 65 COVID-19 Studies from the World Health Organization Database. (2020). https://clinicaltrials.gov/ct2/who_table ACTIV. (2020). https://www.nih.gov/research-training/medical-research-initiatives/activ Coronavirus Treatment Acceleration Program (CTAP). US Food and Drug Administration (2020). https://www.fda.gov/drugs/coronavirus-covid-19-drugs/coronavirus-treatment-acceleration-program-ctap Gleeson, P., Davison, A. P., Silver, R. A. & Ascoli, G. A. A commitment to open source in neuroscience. , 964–965 (2017). Neuron 96 Piwowar, H. et al. The state of OA: a large-scale analysis of the prevalence and impact of open access articles. , e4375 (2018). PeerJ. 6 European Society of Radiology (ESR). What the radiologist should know about artificial intelligence – an ESR white paper. , 44 (2019). Insights Imaging 10 Pesapane, F., Codari, M. & Sardanelli, F. Artificial intelligence in medical imaging: threat or opportunity? Radiologists again at the forefront of innovation in medicine. , 35 (2018). Eur. Radiol. Exp. 2 Price, W. N. 2nd & Cohen, I. G. Privacy in the age of medical big data. , 37–43 (2019). Nat. Med. 25 Liang, W. et al. Development and validation of a clinical risk score to predict the occurrence of critical illness in hospitalized patients with COVID-19. , 1081–1089 (2020). JAMA Intern. Med. 180 Wynants, L. et al. Prediction models for diagnosis and prognosis of covid-19 infection: systematic review and critical appraisal. , m1328 (2020). Brit. Med. J. 369 Zhang, L. et al. D-dimer levels on admission to predict in-hospital mortality in patients with Covid-19. , 1324–1329 (2020). J. Thromb. Haemost. 18 Sands, K. E. et al. Patient characteristics and admitting vital signs associated with coronavirus disease 2019 (COVID-19)-related mortality among patients admitted with noncritical illness. (2020). https://doi.org/10.1017/ice.2020.461 American College of Radiology. CR recommendations for the use of chest radiography and computed tomography (CT) for suspected COVID-19 infection. (2020). https://www.acr.org/Advocacy-and-Economics/ACR-Position-Statements/Recommendations-for-Chest-Radiography-and-CT-for-Suspected-COVID19-Infection Rubin, G. D. et al. The role of chest imaging in patient management during the COVID-19 pandemic: a multinational consensus statement from the Fleischner Society. , 172–180 (2020). Radiology 296 World Health Organization. Use of chest imaging in COVID-19. (2020). https://www.who.int/publications/i/item/use-of-chest-imaging-in-covid-19 Jamil, S. et al. Diagnosis and management of COVID-19 disease. , 10 (2020). Am. J. Respir. Crit. Care Med. 201 Redmond, C. E., Nicolaou, S., Berger, F. H., Sheikh, A. M. & Patlas, M. N. Emergency radiology during the COVID-19 pandemic: The Canadian Association of Radiologists Recommendations for Practice. , 425–430 (2020). Can. Assoc. Radiologists J. 71 Buch, V. et al. Development and validation of a deep learning model for prediction of severe outcomes in suspected COVID-19 Infection. Preprint at (2021). https://arxiv.org/abs/2103.11269 Lyons, C. & Callaghan, M. The use of high-flow nasal oxygen in COVID-19. , 843–847 (2020). Anaesthesia 75 Whittle, J. S., Pavlov, I., Sacchetti, A. D., Atwood, C. & Rosenberg, M. S. Respiratory support for adult patients with COVID-19. , 95–101 (2020). J. Am. Coll. Emerg. Physicians Open 1 Ai, J., Li, Y., Zhou, X. & Zhang, W. COVID-19: treating and managing severe cases. , 370–371 (2020). Cell Res. 30 Esteva, A. et al. A guide to deep learning in healthcare. , 24–29 (2019). Nat. Med. 25 Cahan, E. M., Hernandez-Boussard, T., Thadaney-Israni, S. & Rubin, D. L. Putting the data before the algorithm in big data addressing personalized healthcare. , 78 (2019). NPJ Digit. Med. 2 Thrall, J. H. et al. Artificial intelligence and machine learning in radiology: opportunities, challenges, pitfalls, and criteria for success. , 504–508 (2018). J. Am. Coll. Radiol. 15 Shilo, S., Rossman, H. & Segal, E. Axes of a revolution: challenges and promises of big data in healthcare. , 29–38 (2020). Nat. Med. 26 Gao, Y. & Cui, Y. Deep transfer learning for reducing health care disparities arising from biomedical data inequality. , 5131 (2020). Nat. Commun. 11 Rieke, N. et al. The future of digital health with federated learning. , 119 (2020). NPJ Dig. Med. 3 Yang, Q., Liu, Y., Chen, T. & Tong, Y. Federated machine learning: concept and applications. , 12 (2019). ACM Trans. Intell. Syst. Technol. 10 Ma, C. et al. On safeguarding privacy and security in the framework of federated learning. , 242–248 (2020). IEEE Netw. 34 Brisimi, T. S. et al. Federated learning of predictive models from federated Electronic Health Records. , 59–67 (2018). Int. J. Med. Inform. 112 Roth, H. R. et al. Federated learning for breast density classification: a real-world implementation. In , (eds. Albarqouni, S. et al.) Vol. 12,444, 181–191 (Springer International Publishing, 2020). Proc. Second MICCAI Workshop, DART 2020 and First MICCAI Workshop, DCL 2020 Domain Adaptation and Representation Transfer, and Distributed and Collaborative Learning Sheller, M. J. et al. Federated learning in medicine: facilitating multi-institutional collaborations without sharing patient data. , 12598 (2020). Sci. Rep. 10 Remedios, S. W., Butman, J. A., Landman, B. A. & Pham, D. L. in (eds Remedios, S. W. et al.) (Springer, 2020). Federated Gradient Averaging for Multi-Site Training with Momentum-Based Optimizers Xu, Y. et al. A collaborative online AI engine for CT-based COVID-19 diagnosis. Preprint at (2020). https://www.medrxiv.org/content/10.1101/2020.05.10.20096073v2 Raisaro, J. L. et al. SCOR: A secure international informatics infrastructure to investigate COVID-19. , 1721–1726 (2020). J. Am. Med. Inform. Assoc. 27 Vaid, A. et al. Federated learning of electronic health records to improve mortality prediction in hospitalized patients with COVID-19: machine learning approach. , e24207 (2021). JMIR Med. Inform. 9 Nino, G. et al. Pediatric lung imaging features of COVID-19: a systematic review and meta-analysis. , 252–263 (2021). Pediatr. Pulmonol. 56 Fredrikson, M., Jha, S. & Ristenpart, T. Model inversion attacks that exploit confidence information and basic countermeasures. In 1322–1333, (2015). Proc. 22nd ACM SIGSAC Conference on Computer and Communications Security https://doi.org/10.1145/2810103.2813677 Zhu, L., Liu, Z. & Han, S. in (eds Wallach, H. et al.) 14774–14784 (Curran Associates, Inc., 2019). Advances in Neural Information Processing Systems 32 Kaissis, G. A., Makowski, M. R., Rückert, D. & Braren, R. F. Secure, privacy-preserving and federated machine learning in medical imaging. , 305–311 (2020). Nat. Mach. Intell. 2 Li, W. et al. in 133–141 (Springer, 2019). Privacy-Preserving Federated Brain Tumour Segmentation Shokri, R. & Shmatikov, V. Privacy-preserving deep learning. In (2015). Proc. 53rd Annual Allerton Conference on Communication, Control, and Computing (Allerton) https://doi.org/10.1109/allerton.2015.7447103 Li, X. et al. Multi-site fMRI analysis using privacy-preserving federated learning and domain adaptation: ABIDE results. , 101765 (2020). Med. Image Anal. 65 Estiri, H. et al. Predicting COVID-19 mortality with electronic medical records. , 15 (2021). NPJ Dig. Med. 4 Jiang, G. et al. Harmonization of detailed clinical models with clinical study data standards. , 65–74 (2015). Methods Inf. Med. 54 Yang, D. et al. in . (2019). Searching Learning Strategy with Reinforcement Learning for 3D Medical Image Segmentation https://doi.org/10.1007/978-3-030-32245-8_1 Elsken, T., Metzen, J. H. & Hutter, F. Neural architecture search: a survey. , 1–21 (2019). J. Mach. Learning Res. 20 Yao, Q. et al. Taking human out of learning applications: a survey on automated machine learning. Preprint at (2019). https://arxiv.org/abs/1810.13306 Ioffe, S. & Szegedy, C. Batch normalization: accelerating deep network training by reducing internal covariate shift. In , PMLR , 448–456 (2015). Proc. 32nd International Conf. Machine Learning 37 Kaufman, S., Rosset, S. & Perlich, C. Leakage in data mining: formulation, detection, and avoidance. In , 556–563 (2011). Proc. 17th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining Zhang, C. et al. BatchCrypt: efficient homomorphic encryption for cross-silo federated learning. In , 493–506 (2020). Proc. 2020 USENIX Annual Technical Conference, ATC 2020 . (2020). Nvidia NGC Catalog: COVID-19 Related Models https://ngc.nvidia.com/catalog/models?orderBy=scoreDESC&pageNumber=0&query=covid&quickFilter=models&filters Marini, J. J. & Gattinoni, L. Management of COVID-19 respiratory distress. , 2329–2330 (2020). JAMA 323 Cook, T. M. et al. Consensus guidelines for managing the airway in patients with COVID-19: Guidelines from the Difficult Airway Society, the Association of Anaesthetists the Intensive Care Society, the Faculty of Intensive Care Medicine and the Royal College of Anaesthetist. , 785–799 (2020). Anaesthesia 75 Galloway, J. B. et al. A clinical risk score to identify patients with COVID-19 at high risk of critical care admission or death: an observational cohort study. , 282–288 (2020). J. Infect. 81 Kilaru, A. S. et al. Return hospital admissions among 1419 COVID-19 patients discharged from five U.S. emergency departments. , 1039–1042 (2020). Acad. Emerg. Med. 27 He, K., Zhang, X., Ren, S. & Sun, J. Deep residual learning for image recognition. In (2016). Proc. 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR) https://doi.org/10.1109/cvpr.2016.90 Irvin, J. et al. CheXpert: a large chest radiograph dataset with uncertainty labels and expert comparison. , 590–597 (2019). Proc. AAAI Conf. Artif. Intell. 33 Wang, R., Fu, B., Fu, G. & Wang, M. Deep & Cross network for Ad Click predictions. In Article no. 12 (2017). Proc. ADKDD’17 Abadi, M. et al. TensorFlow: asystem for large-scale machine learning. In , USENIX Association 265–283 (2016). 12th USENIX Symposium on Operating Systems Design and Implementation (OSDI 16) . (2020). NVIDIA Clara Imaging https://developer.nvidia.com/clara-medical-imaging Stekhoven, D. J. & Bühlmann, P. MissForest–non-parametric missing value imputation for mixed-type data. , 112–118 (2012). Bioinformatics 28 McMahan, H., Moore, E., Ramage, D., Hampson, S. & y Arcas, B. A. Communication-efficient learning of deep networks from decentralized data. (2017). http://proceedings.mlr.press/v54/mcmahan17a.html Hsieh, K., Phanishayee, A., Mutlu, O. & Gibbons, P. B. The non-IID data quagmire of decentralized machine learning. In PMLR 119 (2020). Proc. 37th International Conf. Machine Learning Robin, X. et al. pROC: an open-source package for R and S+ to analyze and compare ROC curves. , 77 (2011). BMC Bioinformatics 12 Priznanja MGB zahvalio sljedećim pojedincima za njihovu potporu: J. Brink, Odjel za radiologiju, Massachusetts General Hospital, Boston, MA; N. Guo, Center for Advanced Medical Computing and Analysis, Department of Radiology, Massachusetts General Hospital, Harvard General Medical School, Harvard Medical School, Boston, MA; MA; J. K. Cramer, direktor Centra za kliničke znanosti podataka, Massachusetts General Brigham, Boston, MA; T. Schultz, Center for Biomical Imaging, Massachusetts General Hospital, Boston, MA; S. Pomantz, Odjel za napredne medicinske računalne tehnologije i analize, Odjel za radiologiju, Massachusetts General Hospital, Harvard General Medical School, Boston, MA; MA J. K. Cramer, direktor ovog istraživanja, QTIM laboratorij u Harvard Harvard A. Martinos preko Medicinskog fakulteta, Sveučilišta Chulalongkorn zahvaljuju Ratchadapisek Sompoch Endowment Fund RA (PO) (članak 001/63) za prikupljanje i upravljanje kliničkim podacima i biološkim uzorcima povezanim s COVID-19-om za istraživačku radnu skupinu, Medicinski fakultet, Sveučilište Chulalongkorn. NIHR Cambridge Biomedical Research Centre zahvaljuju A. Priest, koji je podržan od strane NIHR-a (Cambridge Biomedical Research Centre at Cambridge University Hospitals NHS Foundation Trust). Nacionalni tajvanski sveučilišni MeDA Lab i MAHC i tajvanska nacionalna uprava za zdravstveno osiguranje zahvaljujuju MOST Zajedničkom istraživačkom centru za AI tehnologiju, All Vista Nacionalnom zdravstvenom upravom, Taj https://data.ucsf.edu/covid19 Ovaj članak je dostupan u prirodi pod licencom CC by 4.0 Deed (Attribution 4.0 International). Ovaj papir je under CC by 4.0 Deed (Attribution 4.0 International) license. Dostupno u prirodi