Autorii : Ittai Dayan Holger R. Roth Aoxiao Zhong Ahmed Harouni Amilcare Gentili Anas Z. Abidin Andrew Liu Anthony Beardsworth Costa Bradford J. Wood Chien-Sung Tsai Chih-Hung Wang Chun-Nan Hsu C. K. Lee Peiying Ruan Daguang Xu Dufan Wu Eddie Huang Felipe Campos Kitamura Griffin Lacey Gustavo César de Antônio Corradi Gustavo Nino Hao-Hsin Shin Hirofumi Obinata Hui Ren Jason C. Crane Jesse Tetreault Jiahui Guan John W. Garrett Joshua D. Kaggie Jung Gil Park Keith Dreyer Krishna Juluru Kristopher Kersten Marcio Aloisio Bezerra Cavalcanti Rockenbach Marius George Linguraru Masoom A. Haider Meena AbdelMaseeh Nicola Rieke Pablo F. Damasceno Pedro Mario Cruz e Silva Pochuan Wang Sheng Xu Shuichi Kawano Sira Sriswasdi Soo Young Park Thomas M. Grist Varun Buch Watsamon Jantarabenjakul Weichung Wang Won Young Tak Xiang Li Xihong Lin Young Joon Kwon Abood Quraini Andrew Feng Andrew N. Priest Baris Turkbey Benjamin Glicksberg Bernardo Bizzo Byung Seok Kim Carlos Tor-Díez Chia-Cheng Lee Chia-Jung Hsu Chin Lin Chiu-Ling Lai Christopher P. Hess Colin Compas Deepeksha Bhatia Eric K. Oermann Evan Leibovitz Hisashi Sasaki Hitoshi Mori Isaac Yang Jae Ho Sohn Krishna Nand Keshava Murthy Li-Chen Fu Matheus Ribeiro Furtado de Mendonça Mike Fralick Min Kyu Kang Mohammad Adil Natalie Gangai Peerapon Vateekul Pierre Elnajjar Sarah Hickman Sharmila Majumdar Shelley L. McLeod Sheridan Reed Stefan Gräf Stephanie Harmon Tatsuya Kodama Thanyawee Puthanakit Tony Mazzulli Vitor Lima de Lavor Yothin Rakvongthai Yu Rim Lee Yuhong Wen Fiona J. Gilbert Mona G. Flores Quanzheng Li Autorii : Dăncilă Dayan Holger R. Roth Aoxiao Zhong Ahmed Harouni Amilcare gentilă Anas Z. Abidin Andrei Liu Etichetă: Anthony Beardsworth Costa Bradford J. Wood Chien-Sung Țai lui Chih-Hung Wang Chun-Nan Hsu C. K. Lee Răzvan Răzvan Dăncilă Xu Dufan Wu Eddie Huang Felipe Campos Kitamura lui Griffin Lacey Gustavo César de Antonio Corradi lui Gustavo Nino Hao-Hsin Shin Hirofumi Obinata Hui Ren Despre Jason C. Crane lui Jesse Tetreault Jiahui Guan de John W. Garrett Joshua D. Kaggie în viață Parcul Jung Gil lui Keith Dreyer Krishna Juluru Cristian Crăciun Etichetă: Marcio Aloisio Bezerra Cavalcanti Rockenbach Marius George Linguraru Masoom A. Haider Dăncilă AbdelMaseeh Nicola Rică Pablo F. Damascenă Pedro Mario Cruz și Silva Călărași Wang Sheng Xu Căpitanul Kawano Doamna Sriscu Parcul Soo Young Thomas M. Grist Cartea lui Varun Mâncăruri cu cârnați Vâlcea Wang Young Tak a câștigat Xiang Li Cătălin Lin Tânărul Joon Kwon Cuvânt cheie Andrei Feng Andrei N. Priest Bărbatul turc lui Benjamin Glicksberg Bernardă Bizzo Citește mai departe Kim lui Carlos Tor-Díez Cătălin Cheng Lee Chia-Jung Hsu Chin Lin Chiu-Ling Lai lui Christopher P. Hess Colin Compas Deepeksha Bhatia lui Eric K. Oermann lui Evan Leibovitz Hisashi Sasaki Hitoshi Mori Isaac Yang Fiul lui Jae Ho Krishna și Keshava Murthy Li-Chen Fu Cuvânt cheie: Ribeiro Furtado de Mendonça Mike Fralick Mișcarea Kyu Kang Moș Crăciun Natalie Gangai Peerapon Vateekul Pierre Elnajjar de Sarah Hickman Sharmila Majumdar Acasă Shelley L. McLeod Sheridan Reed Stefan Grădină Stephanie Harmonă Tatsuya Kodama Târgu Mureș lui Tony Mazzulli Victor Lima de Muncă Yothin Rakvongthai Cuvânt cheie: Yu Rim Lee Yuhong Wen Votează Fiona J. Gilbert Mona G. Flores Cuvânt cheie abstractă Aici am folosit date de la 20 de institute din întreaga lume pentru a instrui un model FL, numit EXAM (Electronic Medical Record (EMR) chest X-ray AI model), care prezice cerințele viitoare de oxigen ale pacienților simptomatici cu COVID-19 folosind intrări de semne vitale, date de laborator și raze X toracice. EXAM a atins o suprafață medie sub curbă (AUC) > 0,92 pentru a prezice rezultatele la 24 și 72 de ore de la momentul prezentării inițiale la camera de urgență, și a oferit o îmbunătățire de 16% a cerințelor medii AUC măsurate pe toate site-urile participante și o creștere medie a generalizării clinice de 38% în comparație cu modelele specifice instruite pe un singur principală Comunitățile științifice, academice, medicale și de știință a datelor s-au reunit în fața crizei pandemice COVID-19 pentru a evalua rapid paradigme noi în domeniul inteligenței artificiale (AI) care sunt rapide și sigure și potențial să încurajeze schimbul de date și formarea și testarea modelelor fără barierele obișnuite de confidențialitate și de proprietate a datelor ale colaborărilor convenționale. , Furnizorii de servicii medicale, cercetătorii și industria s-au concentrat pe abordarea nevoilor clinice nesatisfăcute și critice create de criză, cu rezultate remarcabile. , , , , , , Recrutarea în cadrul studiilor clinice a fost accelerată și facilitată de organismele naționale de reglementare și de spiritul cooperării internaționale , , Disciplinele de analiză a datelor și AI au favorizat întotdeauna abordări deschise și colaborative, care îmbrățișează concepte precum software-ul open-source, cercetarea reproductibilă, depozitele de date și punerea la dispoziția publicului a seturilor de date anonime. , Pandemia a subliniat necesitatea de a desfășura rapid colaborări de date care să împuternicească comunitățile clinice și științifice atunci când răspund la provocările globale care evoluează rapid și sunt răspândite pe scară largă. , , . 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 Un exemplu concret al acestor tipuri de colaborare este lucrarea noastră anterioară cu privire la un model de sprijin pentru deciziile clinice (CDS) SARS-COV-2 bazat pe IA. Acest model CDS a fost dezvoltat la Mass General Brigham (MGB) și a fost validat pe baza datelor din mai multe sisteme de sănătate. , , , CXR a fost selectat ca intrare de imagistică deoarece este disponibilă pe scară largă și este indicată în mod obișnuit de orientări, cum ar fi cele furnizate de ACR Societatea Fleischner Organizația WHO Societățile naționale toracice Manualele COVID ale Ministerului Sănătății și Societățile de Radiologie din întreaga lume Rezultatul modelului CDS a fost un scor, numit CORISK , care corespunde cerințelor de susținere a oxigenului și care ar putea ajuta la examinarea pacienților de către clinicienii de frunte , , Furnizorii de servicii medicale au fost cunoscuți pentru a prefera modele care au fost validate pe propriile date Până în prezent, majoritatea modelelor de inteligență artificială, inclusiv modelul CDS menționat mai sus, au fost instruite și validate pe date „stricte” care adesea lipsesc de diversitate. , Acest lucru poate fi atenuat prin instruirea cu date diverse de la mai multe site-uri fără centralizarea datelor folosind metode precum transferul de cunoştinţe , FL este o metodă utilizată pentru a instrui modele AI pe surse de date disparate, fără ca datele să fie transportate sau expuse în afara locației lor inițiale. . 18 19 20 21 22 23 24 25 26 27 28 29 30 27 31 32 33 34 35 36 Învățarea federată susține lansarea rapidă a experimentelor orchestrate central, cu o trasabilitate îmbunătățită a datelor și evaluarea schimbărilor algoritmice și a impactului O abordare a FL, numită client-server, trimite un model „neinstruit” altor servere („noduri”) care efectuează sarcini parțiale de instruire, trimițând, la rândul său, rezultatele înapoi pentru a fi fuzionate în serverul central („federat”). . 37 36 Guvernanța datelor pentru FL este menținută la nivel local, reducând preocupările legate de confidențialitate, cu doar greutățile modelului sau gradientele comunicate între site-urile client și serverul federat , FL a demonstrat deja promisiuni în aplicațiile recente de imagistică medicală , , , Analiză COVID-19 , , Un exemplu remarcabil este un model de predicție a mortalității la pacienții infectați cu SARS-COV-2, care utilizează caracteristici clinice, deși limitate în ceea ce privește numărul de modalități și scara. . 38 39 40 41 42 43 8 44 45 46 Obiectivul nostru a fost de a dezvolta un model robust, generalizabil, care ar putea ajuta la examinarea pacienților. Am teorematizat că modelul CDS poate fi federalizat cu succes, datorită utilizării de intrări de date care sunt relativ frecvente în practica clinică și care nu se bazează în mare măsură pe evaluări dependente de operatori ale stării pacientului (cum ar fi impresiile clinice sau simptomele raportate). Mai degrabă, au fost folosite rezultate de laborator, semne vitale, un studiu de imagistică și o înregistrare demografică comună (adică vârstă). Prin urmare, am re-antrenat modelul CDS cu date diverse folosind o abordare FL client-server pentru a dezvolta un nou model global FL, care a fost numit EXAM, folosind ca intr Ipoteza noastră a fost că EXAM ar funcționa mai bine decât modelele locale și ar generaliza mai bine între sistemele de sănătate. Rezultatele Arhitectura modelului EXAM Modelul EXAM se bazează pe modelul CDS menționat mai sus În total, 20 de caracteristici (19 de la EMR și una de la CXR) au fost utilizate ca intrare în model. Etichetele rezultatului (adică „adevărul de la sol”) au fost atribuite pe baza terapiei cu oxigen a pacientului după perioade de 24 și 72 de ore de la admiterea inițială la departamentul de urgență (ED). . 27 1 Etichetele de rezultate ale pacienţilor au fost stabilite la 0, 0,25, 0,50 şi 0,75 în funcţie de cea mai intensă terapie cu oxigen primită de pacient în fereastra de predicţie. Categoriile de terapie cu oxigen au fost, respectiv, aerul din încăpere (RA), oxigenul cu flux scăzut (LFO), oxigenul cu flux ridicat (HFO)/ventilaţia non-invazivă (NIV) sau ventilaţia mecanică (MV). Dacă pacientul a murit în fereastra de predicţie, eticheta de rezultat a fost setată la 1. Pentru caracteristicile EMR, au fost folosite numai primele valori capturate în ED, iar prelucrarea prealabilă a datelor a inclus dezidentificarea, imputarea valorii lipsă și normalizarea la media zero și varianța unităților. Prin urmare, modelul fuzionează informații din ambele caracteristici EMR și CXR, folosind o rețea neurală convoluțională de 34 de straturi (ResNet34) pentru a extrage caracteristici dintr-o rețea CXR și o rețea Deep & Cross pentru a conecta caracteristicile împreună cu caracteristicile EMR (pentru mai multe detalii, a se vedea Rezultatul modelului este un scor de risc, denumit scor EXAM, care este o valoare continuă în intervalul 0-1 pentru fiecare dintre previziunile de 24 și 72 de ore corespunzătoare etichetelor descrise mai sus. Metodele Federalizarea modelului Modelul EXAM a fost antrenat folosind o cohortă de 16.148 de cazuri, făcându-l nu numai printre primele modele FL pentru COVID-19 ci și un proiect de dezvoltare foarte mare și multicontinent în IA relevant din punct de vedere clinic (Fig. Datele dintre site-uri nu au fost armonizate înainte de extragere și, având în vedere circumstanțele informatice clinice din viața reală, o armonizare meticuloasă a intrărilor de date nu a fost efectuată de către autori (Fig. ) din 1a, b 1C și D , Harta lumii care indică cele 20 de site-uri diferite ale clientului care contribuie la studiul EXAM. , Numărul de cazuri contribuite de fiecare instituție sau site (clientul 1 reprezintă site-ul care contribuie cu cel mai mare număr de cazuri). Distribuția intensității radiografiei pieptului la fiecare locație a clientului. , Vârsta pacienților la fiecare locație client, indicând vârsta minimă și maximă (asteriscuri), vârsta medie (triunghiuri) și deviația standard (barele orizontale). . a b c d 1 Am comparat modelele instruite local cu modelul global FL pe datele de testare ale fiecărui client. 1 × 10–3, testul Wilcoxon semnat-ranking) de 16% (după cum este definit prin AUC medie atunci când rulează modelul pe seturile de testare locale respective: de la 0,795 la 0,920, sau 12,5 puncte procentuale) (Fig. De asemenea, a rezultat o îmbunătățire de 38% a generalizabilității (definită prin AUC medie atunci când rulează modelul pe toate seturile de testare: de la 0,667 la 0,920, sau 25,3 puncte procentuale) a celui mai bun model global pentru predicția tratamentului cu oxigen de 24 de ore în comparație cu modelele instruite numai pe datele proprii ale unui site (Fig. Pentru rezultatele predictive ale tratamentului cu oxigen de 72 de ore, cel mai bun model global de instruire a dus la o îmbunătățire medie a performanței de 18% în comparație cu modelele instruite local, în timp ce generalizabilitatea modelului global sa îmbunătățit în medie cu 34% (Fig. Stabilitatea rezultatelor noastre a fost validată prin repetarea a trei runde de instruire locală și FL pe diferite divizii aleatoare de date. P 2a 2b 1 , Performanța testului fiecărui client este stabilită în predicția tratamentului cu oxigen de 24 de ore pentru modelele instruite pe baza datelor locale (Local) în comparație cu cea a celui mai bun model global disponibil pe server (FL). , Generalizability (average performance on other sites’ test data, as represented by average AUC) as a function of a client’s dataset size (no. of cases). The green horizontal line denotes the generalizability performance of the best global model. The performance for 18 of 20 clients is shown, because client 12 had outcomes only for 72-h oxygen (Extended Data Fig. ) și clientul 14 a avut cazuri numai cu tratament RA, astfel încât metrica de evaluare (av. AUC) nu a fost aplicabilă în niciunul dintre aceste cazuri ( Datele pentru client 14 au fost, de asemenea, excluse din calculul generalizabilității medii în modelele locale. a b 1 Metodele Modelele locale care au fost instruite folosind cohorte dezechilibrate (de exemplu, în majoritate cazuri ușoare de COVID-19) au beneficiat în mod semnificativ de abordarea FL, cu o îmbunătățire substanțială a performanței AUC medii de predicție pentru categoriile cu doar câteva cazuri. Acest lucru a fost evident la site-ul client 16 (un set de date dezechilibrat), cu majoritatea pacienților cu severitate ușoară a bolii și cu doar câteva cazuri severe. and Extended Data Fig. Mai important, generalizabilitatea modelului FL a fost crescută considerabil față de modelul instruit local. 3a 2 , ROC at client site 16, with unbalanced data and mostly mild cases. , ROC al modelului local la site-ul client 12 (un set de date mic), ROC mediu al modelelor instruite pe seturi de date mai mari corespunzătoare celor cinci site-uri client din zona Boston (1, 4, 5, 6, 8) și ROC al celui mai bun model global în predicția tratamentului cu oxigen de 72 de ore pentru diferite praguri ale scorului EXAM (stânga, mijlocie, dreapta). ROC mediu este calculat pe baza a cinci modele instruite local, în timp ce zona gri indică abaterea standard ROC. ROCs pentru trei valori diferite de tăiere ( ) of the EXAM risk score are shown. Pos and neg denote the number of positive and negative cases, respectively, as defined by this range of EXAM score. a b t În cazul site-urilor client cu seturi de date relativ mici, cel mai bun model FL a depășit în mod semnificativ nu numai modelul local, ci și cele instruite pe seturi de date mai mari de la cinci site-uri client din zona Boston a SUA (Fig. ) din 3b Modelul global a avut rezultate bune în predicția nevoilor de oxigen la 24/72 ore la pacienții cu COVID pozitiv și negativ (Fig. ) din 3 Validare pe site-uri independente După formarea inițială, EXAM a fost testat ulterior la trei site-uri independente de validare: Spitalul Cooley Dickinson (CDH), Spitalul Martha’s Vineyard (MVH) și Spitalul Nantucket Cottage (NCH), toate din Massachusetts, SUA. , iar curbele ROC și matrice de confuzie pentru cel mai mare set de date (de la CDH) sunt prezentate în Fig. Punctul de operare a fost setat pentru a distinge între ventilația nemecanică și ventilația mecanică (MV) tratamentul (sau moartea). modelul global de formare FL, EXAM, a atins o AUC medie de 0,944 și 0,924 pentru sarcinile de predicție de 24 și 72 de ore, respectiv (Tabel). ), which exceeded the average performance among sites used in training EXAM. For prediction of MV treatment (or death) at 24 h, EXAM achieved a sensitivity of 0.950 and specificity of 0.882 at CDH, and a sensitivity of 1.000 specificity of 0.934 at MVH. NCH did not have any cases with MV/death at 24 h. In regard to 72-h MV prediction, EXAM achieved a sensitivity of 0.929 and specificity of 0.880 at CDH, sensitivity of 1.000 and specificity of 0.976 at MVH and sensitivity of 1.000 and specificity of 0.929 at NCH. 2 4 2 , , Performanța (ROC) (în partea de sus) și matrice de confuzie (în partea de jos) ale modelului EXAM FL pe setul de date CDH pentru predicția cerinței de oxigen la 24 h ( ) and 72 h ( ROC pentru trei valori diferite de tăiere ( ) din scorul de risc al examenului sunt prezentate. a b a b t For MV at CDH at 72 h, EXAM had a low false-negative rate of 7.1%. Representative failure cases are presented in Extended Data Fig. , showing two false-negative cases from CDH where one case had many missing EMR data features and the other had a CXR with a motion artifact and some missing EMR features. 4 Utilizarea confidențialității diferențiale A primary motivation for healthcare institutes to use FL is to preserve the security and privacy of their data, as well as adherence to data compliance measures. For FL, there remains the potential risk of model ‘inversion’ or even the reconstruction of training images from the model gradients themselves Pentru a contracara aceste riscuri, s-au utilizat măsuri de îmbunătățire a securității pentru a atenua riscul în cazul „interceptării” datelor în timpul comunicării site-server. . We experimented with techniques to avoid interception of FL data, and added a security feature that we believe could encourage more institutions to use FL. We thus validated previous findings showing that partial weight sharing, and other differential privacy techniques, can successfully be applied in FL Prin investigarea unei scheme parțiale de împărțire a greutății , , , we showed that models can reach a comparable performance even when only 25% of weight updates are shared (Extended Data Fig. ) din 47 48 49 50 50 51 52 5 Discuție This study features a large, real-world healthcare FL study in terms of number of sites and number of data points used. We believe that it provides a powerful proof-of-concept of the feasibility of using FL for fast and collaborative development of needed AI models in healthcare. Our study involved multiple sites across four continents and under the oversight of different regulatory bodies, and thus holds the promise of being provided to different regulated markets in an expedited way. The global FL model, EXAM, proved to be more robust and achieved better results at individual sites than any model trained on only local data. We believe that consistent improvement was achieved owing to a larger, but also a more diverse, dataset, the use of data inputs that can be standardized and avoidance of clinical impressions/reported symptoms. These factors played an important part in increasing the benefits from this FL approach and its impact on performance, generalizability and, ultimately, the model’s usability. Pentru un site client cu un set de date relativ mic, două abordări tipice ar putea fi utilizate pentru a potrivi un model util: una este de a instrui local cu datele proprii, cealaltă este de a aplica un model instruit pe un set de date mai mare. Pentru site-urile cu seturi de date mici, ar fi fost practic imposibil să se construiască un model de învățare profundă performantă folosind numai datele lor locale. Concluzia, că aceste două abordări au depășit toate cele trei sarcini de predicție de către modelul global FL, indică faptul că beneficiul pentru site-urile client cu seturi de date mici care rezultă din participarea la colaborările FL este substanțial. Acest lucru este probabil o reflectare a capacității FL de a captura mai multă diversitate decât formarea locală și de a atenua bias . 46 Rezultatele validării au confirmat faptul că modelul global este robust, susținând ipoteza noastră că modelele instruite de FL sunt generalizabile în toate sistemele de asistență medicală. Acestea oferă un caz convingător pentru utilizarea algoritmilor predictivi în îngrijirea pacienților COVID-19 și utilizarea FL în crearea și testarea modelelor. Prin participarea la acest studiu, site-urile clientului au primit acces la EXAM, pentru a fi validate în continuare înainte de a urmări orice aprobare de reglementare sau introducere viitoare în îngrijirea clinică. , as well as at different sites that were not a part of the EXAM training. 53 Peste 200 de modele de predicție pentru a sprijini luarea deciziilor la pacienții cu COVID-19 au fost publicate . Unlike the majority of publications focused on diagnosis of COVID-19 or prediction of mortality, we predicted oxygen requirements that have implications for patient management. We also used cases with unknown SARS-COV-2 status, and so the model could provide input to the physician ahead of receiving a result for PCR with reverse transcription (RT–PCR), making it useful for a real-life clinical setting. The model’s imaging input is used in common practice, in contrast with models that use chest computed tomography, a nonconsensual diagnostic modality. The model’s design was constrained to objective predictors, unlike many published studies that leveraged subjective clinical impressions. The data collected reflect varied incidence rates, and thus the ‘population momentum’ we encountered is more diverse. This implies that the algorithm can be useful in populations with different incidence rates. 19 Identificarea cohortei pacienților și armonizarea datelor nu sunt probleme noi în cercetare și știința datelor Îmbunătățiri ale sistemelor de informații clinice sunt necesare pentru a raționaliza pregătirea datelor, ceea ce duce la o mai bună utilizare a unei rețele de site-uri care participă la FL. Acest lucru, în combinație cu ingineria hiperparametrică, poate permite algoritmilor să „învețe” mai eficient din loturi mai mari de date și să adapteze parametrii modelului la un anumit site pentru o personalizare suplimentară – de exemplu, printr-un tuning suplimentar pe acel site. . A system that would allow seamless, close-to real-time model inference and results processing would also be of benefit and would ‘close the loop’ from training to model deployment. 54 39 Deoarece datele nu au fost centralizate, ele nu sunt ușor accesibile. Ținând cont de aceasta, orice analiză viitoare a rezultatelor, dincolo de ceea ce a fost derivat și colectat, este limitată. Similar to other machine learning models, EXAM is limited by the quality of the training data. Institutions interested in deploying this algorithm for clinical care need to understand potential biases in the training. For example, the labels used as ground truth in the training of the EXAM model were derived from 24- and 72-h oxygen consumption in the patient; it is assumed that oxygen delivered to the patient equates the oxygen need. However, in the early phase of the COVID-19 pandemic, many patients were provided high-flow oxygen prophylactically regardless of their oxygen need. Such clinical practice could skew the predictions made by this model. Since our data access was limited, we did not have sufficient available information for the generation of detailed statistics regarding failure causes, post hoc, at most sites. However, we did study failure cases from the largest independent test site, CDH, and were able to generate hypotheses that we can test in the future. For high-performing sites, it seems that most failure cases fall into one of two categories: (1) low quality of input data—for example, missing data or motion artifact in CXR; or (2) out-of-distribution data—for example a very young patient. În viitor, intenționăm, de asemenea, să investigăm potențialul unei „drifturi a populației” din cauza diferitelor faze ale progresiei bolii. O caracteristică care ar îmbunătăți aceste tipuri de colaborare la scară largă este capacitatea de a prezice contribuția fiecărui site client la îmbunătățirea modelului global FL. Acest lucru va ajuta la selectarea site-ului client și la prioritizarea eforturilor de colectare și anotare a datelor. Future approaches may incorporate automated hyperparameter searching , neural architecture search and other automated machine learning approaches to find the optimal training parameters for each client site more efficiently. 55 56 57 Known issues of batch normalization (BN) in FL ne-a motivat să fixăm modelul nostru de bază pentru extracția caracteristicilor imaginii to reduce the divergence between unbalanced client sites. Future work might explore different types of normalization techniques to allow the training of AI models in FL more effectively when client data are nonindependent and identically distributed. 58 49 Lucrările recente privind atacurile asupra confidențialității în cadrul setării FL au ridicat îngrijorări cu privire la scurgerile de date în timpul instruirii modelului Între timp, algoritmii de protecție rămân neexplorați și constrânși de mai mulți factori. , , protecţie bună, ele pot slăbi performanţa modelului. algoritmi de criptare, cum ar fi criptarea omomorfică Un mod cuantificabil de a măsura confidențialitatea ar permite alegeri mai bune pentru a decide parametrii minimi de confidențialitate necesari, menținând în același timp performanța acceptabilă din punct de vedere clinic , , . 59 36 48 49 60 36 48 49 După validarea ulterioară, vedem implementarea modelului EXAM în setarea ED ca o modalitate de a evalua riscurile atât la nivelul pacientului, cât și la nivelul populației și de a oferi medicilor un punct de referință suplimentar atunci când efectuează sarcina adesea dificilă de examinare a pacienților. De asemenea, vedem utilizarea modelului ca o metrică mai sensibilă la nivelul populației pentru a ajuta la echilibrarea resurselor între regiuni, spitale și departamente. Methods Ethics approval All procedures were conducted in accordance with the principles for human experimentation as defined in the Declaration of Helsinki and International Conference on Harmonization Good Clinical Practice guidelines, and were approved by the relevant institutional review boards at the following validation sites: CDH, MVH, NCH and at the following training sites: MGB, Mass General Hospital (MGH), Brigham and Women’s Hospital, Newton-Wellesley Hospital, North Shore Medical Center and Faulkner Hospital (all eight of these hospitals were covered under MGB’s ethics board reference, no. 2020P002673, and informed consent was waived by the instititional review board (IRB). Similarly, participation of the remaining sites was approved by their respective relevant institutional review processes: Children’s National Hospital in Washington, DC (no. 00014310, IRB certified exempt); NIHR Cambridge Biomedical Research Centre (no. 20/SW/0140, informed consent waived); The Self-Defense Forces Central Hospital in Tokyo (no. 02-014, informed consent waived); National Taiwan University MeDA Lab and MAHC and Taiwan National Health Insurance Administration (no. 202108026 W, informed consent waived); Tri-Service General Hospital in Taiwan (no. B202105136, informed consent waived); Kyungpook National University Hospital in South Korea (no. KNUH 2020-05-022, informed consent waived); Faculty of Medicine, Chulalongkorn University in Thailand (nos. 490/63, 291/63, informed consent waived); Diagnosticos da America SA in Brazil (no. 26118819.3.0000.5505, informed consent waived); University of California, San Francisco (no. 20-30447, informed consent waived); VA San Diego (no. H200086, IRB certified exempt); University of Toronto (no. 20-0162-C, informed consent waived); National Institutes of Health in Bethesda, Maryland (no. 12-CC-0075, informed consent waived); University of Wisconsin-Madison School of Medicine and Public Health (no. 2016-0418, informed consent waived); Memorial Sloan Kettering Cancer Center in New York (no. 20-194, informed consent waived); and Mount Sinai Health System in New York (no. IRB-20-03271, informed consent waived). MI-CLAIM guidelines for reporting of clinical AI models were followed (Supplementary Note ) 2 Studii de setare Studiul a inclus date de la 20 de instituții (Fig. ): MGB, MGH, Spitalul Brigham și Femeile, Spitalul Newton-Wellesley, Centrul Medical North Shore și Spitalul Faulkner; Spitalul Național pentru Copii din Washington, DC; Centrul de Cercetare Biomedicală NIHR Cambridge; Spitalul Central al Forțelor de Apărare din Tokyo; National Taiwan University MeDA Lab și MAHC și Administrația Națională de Asigurări de Sănătate din Taiwan; Spitalul General Tri-Service din Taiwan; Spitalul Național Kyungpook din Coreea de Sud; Facultatea de Medicină, Universitatea Chulalongkorn din Thailanda; Diagnosticos da America SA din Brazilia; Universitatea din California, San Francisco; VA San Diego; Universitatea din Toronto; Institutele Naționale de Sănătate din Bethesda, , , Datele de la trei site-uri independente au fost utilizate pentru validare independentă: CDH, MVH și NCH, toate în Massachusetts, SUA. Aceste trei spitale aveau caracteristici ale populației pacienților diferite de cele ale site-urilor de instruire. Datele utilizate pentru validarea algoritmului au constat din pacienții admiși la ED la aceste site-uri între martie 2020 și februarie 2021, care au îndeplinit aceleași criterii de includere ca și datele utilizate pentru instruirea modelului FL. 1a 61 62 63 Colectarea datelor Cele 20 de site-uri client au pregătit un total de 16.148 de cazuri (atât pozitive cât și negative) în scopul instruirii, validării și testării modelului (Fig. Datele medicale au fost accesate în legătură cu pacienții care au îndeplinit criteriile de includere în studiu.Site-urile clienților s-au străduit să includă toate cazurile COVID-pozitive de la începutul pandemiei în decembrie 2019 și până la momentul în care au început instruirea locală pentru studiul EXAM.Toate instruirile locale au început până la 30 septembrie 2020.Site-urile au inclus și alți pacienți în aceeași perioadă cu rezultate negative ale testelor RT-PCR.Deoarece majoritatea site-urilor aveau mai mulți pacienți SARS-COV-2-negativi decât pacienți -pozitivi, am limitat numărul de pacienți negativi incluși la cel mult 95% din totalul cazurilor la fiecare site client. 1b A ‘case’ included a CXR and the requisite data inputs taken from the patient’s medical record. A breakdown of the cohort size of the dataset for each client site is shown in Fig. Distribuția și tiparele intensității imaginii CXR (valorile de pixeli) au variat foarte mult între site-uri datorită unei multitudini de factori specifici pentru pacienți și site-uri, cum ar fi diferiți producători de dispozitive și protocoale de imagistică, după cum se arată în Fig. Vârsta pacienților și distribuția caracteristicilor EMR au variat foarte mult între site-uri, așa cum era de așteptat din cauza diferențelor demografice între spitalele distribuite la nivel global (Fig. ). 1b 1c,d 6 Criterii de includere a pacientului Criteriile de includere a pacientului au fost: (1) pacientul prezentat la ED spitalului sau echivalent; (2) pacientul a avut un test RT-PCR efectuat în orice moment între prezentarea la ED și descărcarea din spital; (3) pacientul a avut un CXR în ED; și (4) înregistrarea pacientului a avut cel puțin cinci dintre valorile EMR detaliate în tabel. , all obtained in the ED, and the relevant outcomes captured during hospitalization. Of note, The CXR, laboratory results and vitals used were the first available for capture during the visit to the ED. The model did not incorporate any CXR, laboratory results or vitals acquired after leaving the ED. 1 Modelul de intrare În total, 21 de caracteristici EMR au fost utilizate ca intrare în model. etichetele rezultatului (adică adevărul de teren) au fost alocate pe baza cerințelor pacientului după perioadele de 24 și 72 de ore de la admiterea inițială la ED. O listă detaliată a caracteristicilor și rezultatelor EMR solicitate poate fi văzută în Tabel . 1 Distribuția tratamentului cu oxigen utilizând diferite dispozitive pe diferite site-uri client este prezentată în Figura de date extinse. , which details the device usage at admission to the ED and after 24- and 72-h periods. The difference in dataset distribution between the largest and smallest client sites can be seen in Extended Data Fig. . 7 8 Numărul de cazuri pozitive de COVID-19, confirmat printr-un singur test RT-PCR obținut în orice moment între prezentarea la ED și descărcarea din spital, este enumerat în tabelul suplimentar. . Each client site was asked to randomly split its dataset into three parts: 70% for training, 10% for validation and 20% for testing. For both 24- and 72-h outcome prediction models, random splits for each of the three repeated local and FL training and evaluation experiments were independently generated. 1 Examen de dezvoltare a modelului There is wide variation in the clinical course of patients who present to hospital with symptoms of COVID-19, with some experiencing rapid deterioration in respiratory function requiring different interventions to prevent or mitigate hypoxemia , O decizie crucială luată în timpul evaluării unui pacient la punctul inițial de îngrijire, sau în timpul ED, este dacă pacientul este susceptibil să necesite contra-măsuri sau intervenții mai invazive sau cu resurse limitate (cum ar fi anticorpi MV sau monoclonali) și, prin urmare, ar trebui să primească o terapie rară, dar eficientă, o terapie cu un raport risc-beneficiu îngust din cauza efectelor secundare sau un nivel mai ridicat de îngrijire, cum ar fi admiterea la unitatea de terapie intensivă. În contrast, un pacient care este la un risc mai mic de a necesita terapie cu oxigen invaziv poate fi plasat într-un cadru de îngrijire mai puțin intensivă, cum ar fi o cameră obișnuită, sau chiar eliberat din ED pentru continuarea auto-monitorizării la domiciliu. EXAM a fost dezvoltat pentru a ajuta la sortarea acestor pacienți. 62 63 64 65 Of note, the model is not approved by any regulatory agency at this time and it should be used only for research purposes. Scorul examenului EXAM was trained using FL; it outputs a risk score (termed EXAM score) similar to CORISK (Data extinsă Fig. Acesta corespunde cerințelor de susținere a oxigenului ale unui pacient în două ferestre - 24 și 72 h - după prezentarea inițială la ED. Ilustrează modul în care scorurile CORISK și EXAM pot fi utilizate pentru sortarea pacienților. 27 9a 9b Imaginile cu raze X ale pieptului au fost preprocesate pentru a selecta imaginea poziției anterioare și pentru a exclude imaginile de vizualizare laterală, apoi scalate la o rezoluție de 224 × 224. , modelul fuzionează informații din ambele caracteristici EMR și CXR (pe baza unui ResNet34 modificat cu atenție spațială Pre-antrenat pe setul de date CheXpert) and the Deep & Cross network Pentru a converge aceste tipuri diferite de date, un vector de caracteristici 512-dimensional a fost extras din fiecare imagine CXR folosind un ResNet34 pre-treat, cu atenție spațială, apoi concatenat cu caracteristicile EMR ca intrare pentru rețeaua Deep & Cross. Am folosit cross-entropia ca funcție de pierdere și „Adam” ca optimizator. Etichetă: NVIDIA Clara Train SDK AUC medie pentru sarcinile de clasificare (≥LFO, ≥HFO/NIV sau ≥MV) a fost calculată și utilizată ca metrică de evaluare finală, cu normalizare la medie zero și varianță unitară. imaginile CXR au fost preprocesate pentru a selecta seria corectă și a exclude imaginile vizualizate laterale, apoi scalate la o rezoluție de 224 × 224 (ref. ) din 9a 66 67 68 9b 69 70 27 Imputare și normalizare Algoritmul lui MissForest a fost folosit pentru a imputa caracteristicile EMR, pe baza setului de date de instruire local. Dacă o caracteristică EMR lipsea complet dintr-un set de date de site-ul client, a fost utilizată valoarea medie a acestei caracteristici, calculată exclusiv pe date de pe site-urile client MGB. 71 Detalii despre fuziunea de date EMR-CXR utilizând rețeaua Deep & Cross Pentru a modela interacțiunile caracteristicilor din datele EMR și CXR la nivel de caz, a fost utilizată o schemă de caracteristici profunde bazată pe o arhitectură de rețea Deep & Cross. . Binary and categorical features for the EMR inputs, as well as 512-dimensional image features in the CXR, were transformed into fused dense vectors of real values by embedding and stacking layers. The transformed dense vectors served as input to the fusion framework, which specifically employed a crossing network to enforce fusion among input from different sources. The crossing network performed explicit feature crossing within its layers, by conducting inner products between the original input feature and output from the previous layer, thus increasing the degree of interaction across features. At the same time, two individual classic deep neural networks with several stacked, fully connected feed-forward layers were trained. The final output of our framework was then derived from the concatenation of both classic and crossing networks. 68 FL details Probabil cea mai stabilită formă de FL este implementarea algoritmului de medie federalizată, așa cum a propus McMahan et al. , sau variații ale acestuia. Acest algoritm poate fi realizat folosind o setare client-server în care fiecare site participant acționează ca client. Se poate gândi la FL ca o metodă care vizează minimizarea unei funcții globale de pierdere prin reducerea unui set de funcții locale de pierdere, care sunt estimate la fiecare site. Prin minimizarea pierderii locale a fiecărui site client, în timp ce sincronizarea greutăților site-ului client învățate pe un server de agregare centralizat, se poate minimiza pierderea globală fără a fi nevoie să se acceseze întregul set de date într-o locație centralizată. Fiecare site-ul client învață local și împărtășește actualizări ale greutății modelului cu un server central care agregă contribuțiile utilizând protocoale de cri ). 72 9c A pseudoalgorithm of FL is shown in Supplementary Note . In our experiments, we set the number of federated rounds at = 200, cu o etapă de antrenament locală pe rundă la fiecare client. numărul de clienți, , a fost de până la 20 în funcție de conectivitatea de rețea a clienților sau de datele disponibile pentru o anumită perioadă țintită de rezultat (24 sau 72 h). , depinde de dimensiunea setului de date la fiecare client și este folosit pentru a cântări contribuțiile fiecărui client atunci când se agregă greutățile modelului în medie federată. În timpul sarcinii de instruire FL, fiecare site client își selectează cel mai bun model local prin urmărirea performanței modelului pe setul său de validare locală. În același timp, serverul determină cel mai bun model global pe baza scorurilor medii de validare trimise de la fiecare site client la server după fiecare rundă FL. După finalizarea instruirii FL, cele mai bune modele locale și cel mai bun model global sunt partajate automat cu toate site-urile client și evaluate pe datele lor de testare locală. 1 T t K nk k Optimizatorul Adam a fost folosit atât pentru instruirea locală, cât și pentru FL cu o rată inițială de învățare de 5 × 10–5 și o degradare treptată a ratei de învățare cu un factor 0,5 după fiecare 40 de epoci, ceea ce este important pentru convergența mediei federate. Transformările afine aleatorii, inclusiv rotația, traducerile, tăierea, scalarea și zgomotul și schimbările de intensitate aleatoare, au fost aplicate imaginilor pentru augmentarea datelor în timpul antrenamentului. 73 Datorită sensibilității straturilor BN atunci când se ocupă de diferiți clienți într-un cadru non-independent și distribuit identic, am constatat că cea mai bună performanță a modelului a avut loc atunci când păstrăm ResNet34 pre-antrenat cu atenție spațială parametrii fixați în timpul instruirii FL (adică folosind o rată de învățare de zero pentru acele straturi). Rețeaua Deep & Cross care combină caracteristicile imaginii cu caracteristicile EMR nu conține straturi BN și, prin urmare, nu a fost afectată de problemele de instabilitate BN. 58 47 În acest studiu, am investigat o schemă de conservare a confidențialității care împărtășește doar actualizări parțiale ale modelului între server și site-urile client. Actualizările de greutate au fost clasificate în timpul fiecărei iterări în funcție de mărimea contribuției și numai un anumit procent din cele mai mari actualizări de greutate au fost partajate cu serverul. (Data extinsă Fig. ), which was computed from all non-zero gradients, Δ Poate fi diferit pentru fiecare client in each FL round Variațiile acestei scheme ar putea include tăierea suplimentară a gradientelor mari sau schemele de confidențialitate diferențiale care adaugă zgomot aleatoriu gradientelor, sau chiar datelor brute, înainte de a fi alimentate în rețea . k 5 Războiul(t) k t 49 51 Analiza statistică Am efectuat un test Wilcoxon signat-ranking pentru a confirma semnificația îmbunătățirii observate în performanță între modelul instruit local și modelul FL pentru punctele de timp 24 și 72 de ore (Fig. și extinse date Fig. Ipoteza zero a fost respinsă cu unilateralitate. « 1 × 10–3 in both cases. 2 1 P Corelația Pearson a fost utilizată pentru a evalua generalizabilitatea (robustitatea valorii medii AUC la datele de testare ale altor site-uri client) a modelelor instruite local în raport cu dimensiunea seturilor de date locale respective. = 0.43, = 0.035, degrees of freedom (df) = 17 for the 24-h model and = 0,62 și = 0,003, df = 16 pentru modelul 72-h). Acest lucru indică faptul că dimensiunea setului de date nu este singurul factor care determină robustețea unui model față de datele invizibile. r P r P Pentru a compara curbele ROC din modelul global FL și modelele locale instruite pe diferite site-uri (Fig. ), we bootstrapped 1,000 samples from the data and computed the resulting AUCs. We then calculated the difference between the two series and standardized using the formula = (AUC1 – AUC2)/ , where este diferența standardizată, este deviația standard a diferențelor de bootstrap, iar AUC1 și AUC2 sunt seria AUC de bootstrap corespunzătoare. Cu o distribuţie normală, am obţinut Valorile ilustrate în tabelul suplimentar . The results show that the null hypothesis was rejected with very low valori, indicând semnificaţia statistică a superiorităţii rezultatelor FL. valorile au fost efectuate în R cu biblioteca pROC . 3 D s D s D P 2 P P 74 Deoarece modelul prezice un rezultat discret, un scor continuu de la 0 la 1, o evaluare directă a calibrării, cum ar fi un qqplot, nu este posibilă. ). We conducted one-way analysis of variation (ANOVA) tests to compare local and FL model scores among four ground truth categories (RA, LFO, HFO, MV). The -statistică, calculată ca variația dintre mijloacele eșantionului împărțită prin variația din cadrul eșantioanelor și reprezentând gradul de dispersie între diferitele grupuri, a fost utilizată pentru a cuantifica modelele. -values of five different local sites are 245.7, 253.4, 342.3, 389.8 and 634.8, while that of the FL model is 843.5. Given that larger -values mean that groups are more separable, the scores from our FL model clearly show a greater dispersion among the four ground truth categories. Furthermore, the valoarea testului ANOVA pe modelul FL este <2 × 10–16, indicând faptul că scorurile de predicție FL diferă semnificativ din punct de vedere statistic între diferitele clase de predicție. 10 F F F P Reporting Summary Informaţii suplimentare despre proiectul de cercetare sunt disponibile în legat de acest articol. Raportul de cercetare Nature Disponibilitatea datelor Datele de la cele 20 de institute care au participat la acest studiu rămân sub custodia lor. Aceste date au fost utilizate pentru formare la fiecare dintre site-urile locale și nu au fost partajate cu niciuna dintre celelalte instituții participante sau cu serverul federat și nu sunt disponibile public. Datele de la site-urile de validare independente sunt păstrate de CAMCA, iar accesul poate fi solicitat contactând Q.L. Pe baza determinării de către CAMCA, o revizuire a partajării datelor și o modificare a IRB în scopuri de cercetare poate fi efectuată de administrația de cercetare MGB și în conformitate cu IRB și politica MGB. Disponibilitatea codului Toate codurile și software-ul utilizate în acest studiu sunt disponibile public la NGC. Pentru a accesa, a vă conecta ca oaspete sau a crea un profil, introduceți una dintre adresele URL de mai jos.Modelele instruite, liniile directoare de pregătire a datelor, codul pentru instruire, validarea testării modelului, fișierul readme, ghidul de instalare și fișierele de licență sunt disponibile public la NVIDIA NGC : din Software-ul de învățare federat este disponibil ca parte a Clara Train SDK: Alternativ, utilizaţi această comandă pentru a descărca modelul „wget --content-disposition -O clara_train_covid19_exam_ehr_xray_1.zip”. 61 https://ngc.nvidia.com/catalog/models/nvidia:med:clara_train_covid19_exam_ehr_xray https://ngc.nvidia.com/catalog/containers/nvidia:clara-train-sdk https://api.ngc.nvidia.com/v2/models/nvidia/med/clara_train_covid19_exam_ehr_xray/versions/1/zip Referinţe Budd, J. et al. Digital technologies in the public-health response to COVID-19. , 1183–1192 (2020). Nat. Med. 26 Moorthy, V., Henao Restrepo, A. M., Preziosi, M.-P. & Swaminathan, S. Data sharing for novel coronavirus (COVID-19). , 150 (2020). Bull. World Health Organ. 98 Chen, Q., Allot, A. & Lu, Z. Keep up with the latest coronavirus research. , 193 (2020). Nature 579 Fabbri, F., Bhatia, A., Mayer, A., Schlotter, B. & Kaiser, J. BCG IT spend pulse: how COVID-19 is shifting tech priorities. (2020). https://www.bcg.com/publications/2020/how-covid-19-is-shifting-big-it-spend Candelon, F., Reichert, T., Duranton, S., di Carlo, R. C. & De Bondt, M. The rise of the AI-powered company in the postcrisis world. (2020). https://www.bcg.com/en-gb/publications/2020/business-applications-artificial-intelligence-post-covid Chao, H. et al. Integrative analysis for COVID-19 patient outcome prediction. , 101844 (2021). Med. Image Anal. 67 Zhu, X. et al. Joint prediction and time estimation of COVID-19 developing severe symptoms using chest CT scan. , 101824 (2021). Med. Image Anal. 67 Yang, D. et al. Federated semi-supervised learning for Covid region segmentation in chest ct using multi-national data from China, Italy, Japan. , 101992 (2021). Med. Image Anal. 70 Minaee, S., Kafieh, R., Sonka, M., Yazdani, S. & Jamalipour Soufi, G. Deep-COVID: predicting COVID-19 from chest X-ray images using deep transfer learning. , 101794 (2020). Med. Image Anal. 65 COVID-19 Studies from the World Health Organization Database. (2020). https://clinicaltrials.gov/ct2/who_table ACTIV. (2020). https://www.nih.gov/research-training/medical-research-initiatives/activ Coronavirus Treatment Acceleration Program (CTAP). US Food and Drug Administration (2020). https://www.fda.gov/drugs/coronavirus-covid-19-drugs/coronavirus-treatment-acceleration-program-ctap Gleeson, P., Davison, A. P., Silver, R. A. & Ascoli, G. A. A commitment to open source in neuroscience. , 964–965 (2017). Neuron 96 Piwowar, H. et al. The state of OA: a large-scale analysis of the prevalence and impact of open access articles. , e4375 (2018). PeerJ. 6 European Society of Radiology (ESR). What the radiologist should know about artificial intelligence – an ESR white paper. , 44 (2019). Insights Imaging 10 Pesapane, F., Codari, M. & Sardanelli, F. Artificial intelligence in medical imaging: threat or opportunity? Radiologists again at the forefront of innovation in medicine. , 35 (2018). Eur. Radiol. Exp. 2 Price, W. N. 2nd & Cohen, I. G. Privacy in the age of medical big data. , 37–43 (2019). Nat. Med. 25 Liang, W. et al. Development and validation of a clinical risk score to predict the occurrence of critical illness in hospitalized patients with COVID-19. , 1081–1089 (2020). JAMA Intern. Med. 180 Wynants, L. et al. Prediction models for diagnosis and prognosis of covid-19 infection: systematic review and critical appraisal. , m1328 (2020). Brit. Med. J. 369 Zhang, L. et al. D-dimer levels on admission to predict in-hospital mortality in patients with Covid-19. , 1324–1329 (2020). J. Thromb. Haemost. 18 Sands, K. E. et al. Patient characteristics and admitting vital signs associated with coronavirus disease 2019 (COVID-19)-related mortality among patients admitted with noncritical illness. (2020). https://doi.org/10.1017/ice.2020.461 American College of Radiology. CR recommendations for the use of chest radiography and computed tomography (CT) for suspected COVID-19 infection. (2020). https://www.acr.org/Advocacy-and-Economics/ACR-Position-Statements/Recommendations-for-Chest-Radiography-and-CT-for-Suspected-COVID19-Infection Rubin, G. D. et al. The role of chest imaging in patient management during the COVID-19 pandemic: a multinational consensus statement from the Fleischner Society. , 172–180 (2020). Radiology 296 World Health Organization. Use of chest imaging in COVID-19. (2020). https://www.who.int/publications/i/item/use-of-chest-imaging-in-covid-19 Jamil, S. et al. Diagnosis and management of COVID-19 disease. , 10 (2020). Am. J. Respir. Crit. Care Med. 201 Redmond, C. E., Nicolaou, S., Berger, F. H., Sheikh, A. M. & Patlas, M. N. Emergency radiology during the COVID-19 pandemic: The Canadian Association of Radiologists Recommendations for Practice. , 425–430 (2020). Can. Assoc. Radiologists J. 71 Buch, V. et al. Development and validation of a deep learning model for prediction of severe outcomes in suspected COVID-19 Infection. Preprint at (2021). https://arxiv.org/abs/2103.11269 Lyons, C. & Callaghan, M. The use of high-flow nasal oxygen in COVID-19. , 843–847 (2020). Anaesthesia 75 Whittle, J. S., Pavlov, I., Sacchetti, A. D., Atwood, C. & Rosenberg, M. S. Respiratory support for adult patients with COVID-19. , 95–101 (2020). J. Am. Coll. Emerg. Physicians Open 1 Ai, J., Li, Y., Zhou, X. & Zhang, W. COVID-19: treating and managing severe cases. , 370–371 (2020). Cell Res. 30 Esteva, A. et al. A guide to deep learning in healthcare. , 24–29 (2019). Nat. Med. 25 Cahan, E. M., Hernandez-Boussard, T., Thadaney-Israni, S. & Rubin, D. L. Putting the data before the algorithm in big data addressing personalized healthcare. , 78 (2019). NPJ Digit. Med. 2 Thrall, J. H. et al. Artificial intelligence and machine learning in radiology: opportunities, challenges, pitfalls, and criteria for success. , 504–508 (2018). J. Am. Coll. Radiol. 15 Shilo, S., Rossman, H. & Segal, E. Axes of a revolution: challenges and promises of big data in healthcare. , 29–38 (2020). Nat. Med. 26 Gao, Y. & Cui, Y. Deep transfer learning for reducing health care disparities arising from biomedical data inequality. , 5131 (2020). Nat. Commun. 11 Rieke, N. et al. The future of digital health with federated learning. , 119 (2020). NPJ Dig. Med. 3 Yang, Q., Liu, Y., Chen, T. & Tong, Y. Federated machine learning: concept and applications. , 12 (2019). ACM Trans. Intell. Syst. Technol. 10 Ma, C. et al. On safeguarding privacy and security in the framework of federated learning. , 242–248 (2020). IEEE Netw. 34 Brisimi, T. S. et al. Federated learning of predictive models from federated Electronic Health Records. , 59–67 (2018). Int. J. Med. Inform. 112 Roth, H. R. et al. Federated learning for breast density classification: a real-world implementation. In , (eds. Albarqouni, S. et al.) Vol. 12,444, 181–191 (Springer International Publishing, 2020). Proc. Second MICCAI Workshop, DART 2020 and First MICCAI Workshop, DCL 2020 Domain Adaptation and Representation Transfer, and Distributed and Collaborative Learning Sheller, M. J. et al. Federated learning in medicine: facilitating multi-institutional collaborations without sharing patient data. , 12598 (2020). Sci. Rep. 10 Remedios, S. W., Butman, J. A., Landman, B. A. & Pham, D. L. in (eds Remedios, S. W. et al.) (Springer, 2020). Federated Gradient Averaging for Multi-Site Training with Momentum-Based Optimizers Xu, Y. et al. A collaborative online AI engine for CT-based COVID-19 diagnosis. Preprint at (2020). https://www.medrxiv.org/content/10.1101/2020.05.10.20096073v2 Raisaro, J. L. et al. SCOR: A secure international informatics infrastructure to investigate COVID-19. , 1721–1726 (2020). J. Am. Med. Inform. Assoc. 27 Vaid, A. et al. Federated learning of electronic health records to improve mortality prediction in hospitalized patients with COVID-19: machine learning approach. , e24207 (2021). JMIR Med. Inform. 9 Nino, G. et al. Pediatric lung imaging features of COVID-19: a systematic review and meta-analysis. , 252–263 (2021). Pediatr. Pulmonol. 56 Fredrikson, M., Jha, S. & Ristenpart, T. Model inversion attacks that exploit confidence information and basic countermeasures. In 1322–1333, (2015). Proc. 22nd ACM SIGSAC Conference on Computer and Communications Security https://doi.org/10.1145/2810103.2813677 Zhu, L., Liu, Z. & Han, S. in (eds Wallach, H. et al.) 14774–14784 (Curran Associates, Inc., 2019). Advances in Neural Information Processing Systems 32 Kaissis, G. A., Makowski, M. R., Rückert, D. & Braren, R. F. Secure, privacy-preserving and federated machine learning in medical imaging. , 305–311 (2020). Nat. Mach. Intell. 2 Li, W. et al. in 133–141 (Springer, 2019). Privacy-Preserving Federated Brain Tumour Segmentation Shokri, R. & Shmatikov, V. Privacy-preserving deep learning. In (2015). Proc. 53rd Annual Allerton Conference on Communication, Control, and Computing (Allerton) https://doi.org/10.1109/allerton.2015.7447103 Li, X. et al. Multi-site fMRI analysis using privacy-preserving federated learning and domain adaptation: ABIDE results. , 101765 (2020). Med. Image Anal. 65 Estiri, H. et al. Predicting COVID-19 mortality with electronic medical records. , 15 (2021). NPJ Dig. Med. 4 Jiang, G. et al. Harmonization of detailed clinical models with clinical study data standards. , 65–74 (2015). Methods Inf. Med. 54 Yang, D. et al. in . (2019). Searching Learning Strategy with Reinforcement Learning for 3D Medical Image Segmentation https://doi.org/10.1007/978-3-030-32245-8_1 Elsken, T., Metzen, J. H. & Hutter, F. Neural architecture search: a survey. , 1–21 (2019). J. Mach. Learning Res. 20 Yao, Q. et al. Taking human out of learning applications: a survey on automated machine learning. Preprint at (2019). https://arxiv.org/abs/1810.13306 Ioffe, S. & Szegedy, C. Batch normalization: accelerating deep network training by reducing internal covariate shift. In , PMLR , 448–456 (2015). Proc. 32nd International Conf. Machine Learning 37 Kaufman, S., Rosset, S. & Perlich, C. Leakage in data mining: formulation, detection, and avoidance. In , 556–563 (2011). Proc. 17th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining Zhang, C. et al. BatchCrypt: efficient homomorphic encryption for cross-silo federated learning. In , 493–506 (2020). Proc. 2020 USENIX Annual Technical Conference, ATC 2020 . (2020). Nvidia NGC Catalog: COVID-19 Related Models https://ngc.nvidia.com/catalog/models?orderBy=scoreDESC&pageNumber=0&query=covid&quickFilter=models&filters Marini, J. J. & Gattinoni, L. Management of COVID-19 respiratory distress. , 2329–2330 (2020). JAMA 323 Cook, T. M. et al. Consensus guidelines for managing the airway in patients with COVID-19: Guidelines from the Difficult Airway Society, the Association of Anaesthetists the Intensive Care Society, the Faculty of Intensive Care Medicine and the Royal College of Anaesthetist. , 785–799 (2020). Anaesthesia 75 Galloway, J. B. et al. A clinical risk score to identify patients with COVID-19 at high risk of critical care admission or death: an observational cohort study. , 282–288 (2020). J. Infect. 81 Kilaru, A. S. et al. Return hospital admissions among 1419 COVID-19 patients discharged from five U.S. emergency departments. , 1039–1042 (2020). Acad. Emerg. Med. 27 He, K., Zhang, X., Ren, S. & Sun, J. Deep residual learning for image recognition. In (2016). Proc. 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR) https://doi.org/10.1109/cvpr.2016.90 Irvin, J. et al. CheXpert: a large chest radiograph dataset with uncertainty labels and expert comparison. , 590–597 (2019). Proc. AAAI Conf. Artif. Intell. 33 Wang, R., Fu, B., Fu, G. & Wang, M. Deep & Cross network for Ad Click predictions. In Article no. 12 (2017). Proc. ADKDD’17 Abadi, M. et al. TensorFlow: asystem for large-scale machine learning. In , USENIX Association 265–283 (2016). 12th USENIX Symposium on Operating Systems Design and Implementation (OSDI 16) . (2020). NVIDIA Clara Imaging https://developer.nvidia.com/clara-medical-imaging Stekhoven, D. J. & Bühlmann, P. MissForest–non-parametric missing value imputation for mixed-type data. , 112–118 (2012). Bioinformatics 28 McMahan, H., Moore, E., Ramage, D., Hampson, S. & y Arcas, B. A. Communication-efficient learning of deep networks from decentralized data. (2017). http://proceedings.mlr.press/v54/mcmahan17a.html Hsieh, K., Phanishayee, A., Mutlu, O. & Gibbons, P. B. The non-IID data quagmire of decentralized machine learning. In PMLR 119 (2020). Proc. 37th International Conf. Machine Learning Robin, X. et al. pROC: an open-source package for R and S+ to analyze and compare ROC curves. , 77 (2011). BMC Bioinformatics 12 Recunoaşterea Punctele de vedere exprimate în acest studiu sunt cele ale autorilor și nu neapărat cele ale NHS, NIHR, Departamentul de Sănătate și Asistență Socială sau oricare dintre organizațiile asociate cu acest departament de date clinice. MGB mulțumește următoarelor persoane pentru sprijinul lor: J. Brink, Departamentul de Radiologie, Spitalul General din Massachusetts, Harvard Medical School, Boston, MA; M. Kalra, Departamentul de Radiologie, Spitalul General din Massachusetts, Harvard Medical School, Boston, MA; N. Neumark, Centrul de Cercetare a Datelor Clinice, Massachusetts General Brigham, Boston, MA; T. Schultz, Departamentul de Radiologie, Spitalul General din Massachusetts, Boston, MA; N. Guo, Centrul de Informatică Medicală Avansată și Analiza Prin intermediul Facultății de Medicină, Universitatea Chulalongkorn mulțumește Fondului de Finanțare Ratchadapisek Sompoch RA (PO) (nr. 001/63) pentru colectarea și gestionarea datelor clinice și a eșantioanelor biologice legate de COVID-19 pentru Grupul de Cercetare, Facultatea de Medicină, Universitatea Chulalongkorn. Centrul de Cercetare Biomedicală NIHR Cambridge mulțumește lui A. Priest, care este susținut de NIHR (Centrul de Cercetare Biomedicală din cadrul Fundației Cambridge pentru Spitale Universitare NHS). National Taiwan University MeDA Lab și MAHC și Administrația Națională de Asigurări de Sănătate din Taiwan mulțumesc Centrului Comun de Cercetare pentru Tehnologia AI, Administrației Naționale https://data.ucsf.edu/covid19 Această lucrare este disponibilă în natură sub licența CC by 4.0 Deed (Attribution 4.0 International). Această lucrare este disponibilă în natură sub licența CC by 4.0 Deed (Attribution 4.0 International).