Új adatvédelmi első AI megjósolja a COVID súlyosságát röntgenfelvételek és orvosi nyilvántartások segítségével

A szerzők: Dávid Dávid Holger R. Roth előadása Zsuzsa Zsuzsa Ahmed Harouni Amilcare kedves Anasz Z. Abidin András Liu Anthony Beardsworth Costa Bradford J. Wood Chien-Sung Tsai Chih-Hung Wang Chun-Nan Hsu C. K. Lee Peiying Ruan Daguang Xu Dufan Wu Eddie Huang Felipe Campos Kitamura Griffin Lacey Gustavo César de Antônio Corradi Gustavo Nino Hao-Hsin Shin Hirofumi Obinata Hui Ren Jason C. Crane Jesse Tetreault Jiahui Guan John W. Garrett Joshua D. Kaggie Jung Gil Park Keith Dreyer Krishna Juluru Kristopher Kersten Marcio Aloisio Bezerra Cavalcanti Rockenbach Marius George Linguraru Masoom A. Haider Meena AbdelMaseeh Nicola Rieke Pablo F. Damasceno Pedro Mario Cruz e Silva Pochuan Wang Sheng Xu Shuichi Kawano Sira Sriswasdi Soo Young Park Thomas M. Grist Varun Buch Watsamon Jantarabenjakul Weichung Wang Won Young Tak Xiang Li Xihong Lin Young Joon Kwon Abood Quraini Andrew Feng Andrew N. Priest Baris Turkbey Benjamin Glicksberg Bernardo Bizzo Byung Seok Kim Carlos Tor-Díez Chia-Cheng Lee Chia-Jung Hsu Chin Lin Chiu-Ling Lai Christopher P. Hess Colin Compas Deepeksha Bhatia Eric K. Oermann Evan Leibovitz Hisashi Sasaki Hitoshi Mori Isaac Yang Jae Ho Sohn Krishna Nand Keshava Murthy Li-Chen Fu Matheus Ribeiro Furtado de Mendonça Mike Fralick Min Kyu Kang Mohammad Adil Natalie Gangai Peerapon Vateekul Pierre Elnajjar Sarah Hickman Sharmila Majumdar Shelley L. McLeod Sheridan Reed Stefan Gräf Stephanie Harmon Tatsuya Kodama Thanyawee Puthanakit Tony Mazzulli Vitor Lima de Lavor Yothin Rakvongthai Yu Rim Lee Yuhong Wen Fiona J. Gilbert Mona G. Flores Quanzheng Li A szerzők: Dávid Dávid Holger R. Roth előadása Zsuzsa Zsuzsa Ádám Haróni Amilcare kedves Anasz Z. Abidin András Liu Címkék: Anthony Beardsworth Costa Bradford J. Wood életrajza Csíkszeredai Tsai Csehszlovákia Wang Chun-Nan Hszu C. K. Lee előadása Gyöngyös Ruan Zsuzsa Xu Dufán Wu Édesanyja Huang Felipe Campos Kitamura sztárja Grizzly Lacey Gusztáv Cézár de António Corradi Gusztáv Nino Házimádó Shin Hirofumi Obinata előzetes Győr Ren Jason C. Crane előzetes Jesse Tetreault Jiahui Guan áttekintése Szerző: John W. Garrett Joshua D. Kaggie előzetes A Jung Gil Parkban Következő Keith Dreyer Krisztina György Keresztény Krisztus Főoldal > Marcio Aloisio Bezerra Cavalcanti Rockenbach Mariusz George Linguraru Masóom A. Haider Ádám Ádám Nicolai György Pablo F. Damascenó Pedro Mario Cruz és Silva Pochuan Wang Zsuzsa Xu Székesfehérvár Kawano Szűz Miklós A Young Park Thomas M. Grisz Varun könyve Veszprém vacsora Vágó Wang Young Tak győzelem Szilárd Li Zsuzsa Lin Ifjú Joon Kwon Kálmán Kálmán András Feng Andrew N. Priest előzetes Törökbálint Főoldal > Benjamin Glicksberg FőoldalBernardo Bizzo Megérkezett Kim Következő Carlos Tor-Díez Csia-Cheng Lee elnöke Csia-Jung Hsu Kínai Lin Csíkszereda Lai Főoldal > Christopher P. Hess Colin Compas áttekintése Deepeksha Bhatia Eric K. Oermann előadása Éva Leibovitz Hisashi Szaszaki Hitoshi Mori Izsák Ján Jae Ho fia Kriszna Nand Keshava Murthy Szilveszteri Fu Máté Ribeiro Furtado de Mendonça Mike Fralick A Kyu Kang Mohamed igazságos Nathalie Gangai Pécsi Vatikán Pierre Elnajjar Megszületett Sarah Hickman Sharmila Majumdar Széchenyi L. McLeod Sheridan Reed előzetes István Gróf Szűz Harmon Tatsuya Kóda Szilveszter Szilveszter Tony Mazzulli Vitor Lima a munkában Gyurcsány Gyurcsány Érkezik Yu Rim Lee Gyurcsány Wen Fiona J. Gilbert életrajza Mona G. Virágok Megyeszékhely Li absztrakt Föderált tanulás (FL) adatokat használják, hogy a képzés a mesterséges intelligencia modellek több forrásból származó adatok, miközben az adatok anonimitását, így eltávolítva számos akadályt az adatmegosztás. Itt használtunk adatokat 20 intézmény szerte a világon, hogy a képzés egy FL modell, az úgynevezett EXAM (elektronikus orvosi nyilvántartás (EMR) mellkasi X-ray AI modell), amely megjósolja a jövő oxigénigényét tüneti betegek COVID-19 segítségével bemeneti létfontosságú jelek, laboratóriumi adatok és mellkasi röntgensugarak. EXAM elérte az átlagos terület alatt a görbe (AUC) >0.92 az eredmények előrejelzésére 24 és 72 óra a kezdeti bemutatása a sür fő A tudományos, tudományos, orvosi és adatkutatási közösségek összefogtak a COVID-19 pandémiás válsággal szemben, hogy gyorsan értékeljék a mesterséges intelligencia (AI) új paradigmáit, amelyek gyorsak és biztonságosak, és potenciálisan ösztönözzék az adatmegosztást és a modellezési képzést és tesztelést a hagyományos együttműködések szokásos adatvédelmi és adattulajdonosi akadályai nélkül. , Az egészségügyi szolgáltatók, a kutatók és az iparág összpontosított a válság által létrehozott kielégítetlen és kritikus klinikai igények kezelésére, figyelemre méltó eredményekkel. , , , , , , A klinikai vizsgálatok felvételét a nemzeti szabályozó szervek és a nemzetközi együttműködés szelleme gyorsította és megkönnyítette. , , Az adatelemzés és a mesterséges intelligencia tudományai mindig is nyílt és együttműködő megközelítéseket ösztönöztek, beleértve az olyan fogalmakat, mint a nyílt forráskódú szoftverek, a reprodukálható kutatások, az adatraktárak és az anonimizált adatkészletek nyilvánosan elérhetővé tétele. , A pandémia hangsúlyozta annak szükségességét, hogy a klinikai és tudományos közösségeket a gyorsan változó és széles körben elterjedt globális kihívásokra való reagálás során felhatalmazó adategyüttműködéseket hajtsanak végre.Az adatmegosztás etikai, szabályozási és jogi összetettségekkel jár, amelyeket az egészségügyi adatok világába való közelmúltbeli nagy technológiai vállalatok bejutása hangsúlyoz, és talán némileg bonyolult. , , . 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 Az ilyen típusú együttműködés konkrét példája a mi korábbi munkánk egy AI-alapú SARS-COV-2 klinikai döntéshozatali támogatás (CDS) modelljén.Ezt a CDS modellt a Mass General Brigham (MGB) fejlesztette ki, és több egészségügyi rendszer adatain keresztül validálták.A CDS modellbe való bemenetek a mellkasi röntgen (CXR) képek, a létfontosságú jelek, a demográfiai adatok és a laboratóriumi értékek voltak, amelyek a korábbi publikációkban a COVID-19-es betegek kimenetelének előrejelzésére utalnak. , , , A CXR-t a képalkotási bemenetként választották ki, mert széles körben elérhető és általánosan jelezhető iránymutatások, mint például az ACR. , the Fleischner Society A WHO Nemzeti Thoracic Társaságok Országos Egészségügyi Minisztérium COVID kézikönyvek és radiológiai társaságok szerte a világon A CDS modell kimenete egy pontszám volt, melyet CORISK-nak hívtak. , amely megfelel az oxigén-támogatási követelményeknek, és amely segíthet a betegek frontvonalas klinikai vizsgálatában , , Az egészségügyi szolgáltatók ismert, hogy előnyben részesítik a saját adatai alapján validált modelleket. A mai napig a legtöbb mesterséges intelligencia-modellt, beleértve a fent említett CDS modellt is, „szűk” adatok alapján képezték és validálták, amelyek gyakran hiányoznak a sokszínűségtől. , , ami potenciálisan túlfelszereltséghez és alacsonyabb általánosíthatósághoz vezethet. Ezt enyhítheti az adatok központosítása nélkül több helyszínről származó különböző adatokkal való képzés Olyan módszerek alkalmazása, mint a transzfer tanulás , Az FL egy módszer, amelyet a különböző adatforrásokon alkalmazott mesterséges intelligencia-modellek képzésére használnak anélkül, hogy az adatokat az eredeti helyükön kívül szállítanák vagy feltárnák. . 18 19 20 21 22 23 24 25 26 27 28 29 30 27 31 32 33 34 35 36 A federált tanulás támogatja a központilag szervezett kísérletek gyors elindítását az adatok jobb nyomon követhetőségével és az algoritmikus változások és hatások értékelésével Az egyik megközelítés az FL-hez, az úgynevezett kliens-kiszolgáló, egy „nem képzett” modellt küld más szerverekhez („csomópontok”), amelyek részleges képzési feladatokat végeznek, viszont az eredményeket visszaküldi a központi („föderált”) szerveren történő egyesítésre. . 37 36 Az FL-adatok irányítása helyi szinten történik, enyhítve az adatvédelmi aggályokat, és csak a modell súlyait vagy fokozatait kommunikálják az ügyfélwebhelyek és a szövetségi szerver között. , Az FL már ígéretet tett az orvosi képalkotó alkalmazásokban , , , COVID-19 elemzés , , Egy figyelemre méltó példa a SARS-COV-2-vel fertőzött betegek halálozási előrejelzési modellje, amely klinikai jellemzőket használ, bár korlátozott a módszerek számában és a skálán. . 38 39 40 41 42 43 8 44 45 46 Célunk az volt, hogy olyan robusztus, általánosítható modellt dolgozzunk ki, amely segíthet a betegek tesztelésében. Elméletünk szerint a CDS modellt sikeresen lehet egyesíteni, mivel a klinikai gyakorlatban viszonylag gyakori adatbeviteleket használnak, és amelyek nem támaszkodnak nagy mértékben a beteg állapotának operátorfüggő értékelésére (például klinikai benyomásokra vagy jelentett tünetekre). Ehelyett laboratóriumi eredményeket, létfontosságú jeleket, képalkotó tanulmányt és gyakran rögzített demográfiai adatokat (azaz életkorot) alkalmaztak. Ezért a CDS modellt változatos adatokkal újratanították a kliens-szerver FL megközelítéssel egy új globális FL modell kifejlesztésére, amelyet EXAM A hipotézisünk az volt, hogy az EXAM jobban teljesít, mint a helyi modellek, és jobban általánosítaná az egészségügyi rendszereket. eredmények A vizsga architektúrája Az EXAM modell a fent említett CDS modellen alapul. Összesen 20 tulajdonságot (19 az EMR-ből és egy CXR-ből) használtak a modellbe való belépésként.Az eredmény (azaz a „föld igazsága”) címkéket a páciens oxigénterápiája alapján a sürgősségi osztályon (ED) való kezdeti felvételtől számított 24 és 72 órás időszakok után osztották ki. . 27 1 A betegek kimeneti címkéit 0, 0,25, 0,50 és 0,75 értékre állították be, attól függően, hogy a beteg milyen intenzív oxigénterápiát kapott az előrejelzési ablakban. Az oxigénterápiás kategóriák a szoba levegő (RA), alacsony oxigénáramú oxigén (LFO), magas oxigénáramú oxigén (HFO)/nem invazív szellőztetés (NIV) vagy mechanikus szellőztetés (MV). Ha a beteg meghalt az előrejelzési ablakban, az eredménycímke 1 volt. Az EMR funkciók esetében csak az ED-ben rögzített első értékeket használták, és az adatok előfeldolgozása magában foglalta a deidentifikációt, a hiányzó értékimputációt és a nullás átlagra és az egység varianciára való normalizálást. A modell tehát egyesíti az EMR és a CXR funkciókból származó információkat, egy 34 rétegű konvolucionális ideghálózatot (ResNet34) használva a funkciók kivonására egy CXR és egy Deep & Cross hálózatból, hogy összekapcsolja a funkciókat az EMR funkciókkal (további részletekért lásd: A modell kimenete egy kockázati pontszám, az úgynevezett EXAM pontszám, amely a fent leírt címkéknek megfelelő 24 órás és 72 órás előrejelzések mindegyikének 0–1-es tartományában lévő folyamatos érték. Methods A modell szövetsége Az EXAM modellt 16,148 esetet használva képezték, így nemcsak az első FL modellek közé tartozik a COVID-19 számára, hanem egy nagyon nagy és több kontinensre kiterjedő fejlesztési projekt is a klinikailag releváns AI-ban (Fig. A helyszínek közötti adatok kivonása előtt nem voltak harmonizálva, és a valós klinikai informatikai körülmények fényében az adatbevitel alapos harmonizációját a szerzők nem végezték el (Fig. ) az 1A és B 1C és D , Világtérkép, amely az EXAM tanulmányhoz hozzájáruló 20 különböző ügyféloldalt mutatja. , Az egyes intézmények vagy webhelyek által hozzájárult esetek száma (az 1 ügyfél a legtöbb esetet hozzájáruló webhelyet képviseli). A mellkasi röntgen intenzitás eloszlása minden ügyfélhelyen. , A betegek életkora az egyes ügyféloldalakon, minimális és maximális életkor (csillagok), átlagos életkor (háromszögek) és standard eltérés (horizontális sávok). . a b c d 1 A helyi képzett modelleket összehasonlítottuk a globális FL modellel az egyes ügyfelek tesztadataiban. « 1 × 10–3, Wilcoxon aláírt minősítésű teszt) 16% (amint azt az átlagos AUC határozza meg, amikor a modellt a megfelelő helyi tesztkészleteken futtatja: 0,795 és 0,920, vagy 12,5 százalékpont) (Ábra. Ezenkívül 38%-os általánosíthatósági javulást eredményezett (amint azt a modell valamennyi tesztkészleten futtatott átlagos AUC határozza meg: 0,667-ről 0,920-ra, vagyis 25,3 százalékponttal) a legjobb globális modell a 24 órás oxigénkezelés előrejelzéséhez képest, összehasonlítva azokkal a modellekkel, amelyeket csak a helyszín saját adatai alapján képeztek (Fig. A 72-órás oxigénkezelés előrejelzési eredményei tekintetében a legjobb globális modellképzés 18%-os átlagos teljesítménynövekedést eredményezett a helyileg képzett modellekhez képest, míg a globális modell általánosíthatósága átlagosan 34%-kal javult (Extended Data Fig. Eredményeink stabilitását a helyi és FL képzés három futamának megismétlésével igazolták különböző véletlenszerű adatszakaszokon. P 2a 2b 1 , Az egyes ügyfelek tesztjeinek teljesítménye a helyi adatok alapján képzett modellek 24 órás oxigénkezelésének előrejelzésében (Local) a szerveren elérhető legjobb globális modellhez képest (FL (lásd a legjobbat). , Generalizálhatóság (átlagos teljesítmény más webhelyek tesztadatain, az átlagos AUC-val) az ügyfél adatkészletének méretének függvényében (az esetek száma nincsen). A zöld vízszintes vonal jelzi a legjobb globális modell generalizálhatósági teljesítményét. A 20 ügyfél közül 18 esetében a teljesítményt mutatjuk, mivel a 12 ügyfélnek csak 72 óra oxigén esetén volt eredménye (Extended Data Fig. ) és a 14 kliensnek csak RA-kezeléssel járó esetei voltak, így az értékelési méter (AUC) nem alkalmazható mindegyik esetben ( Az ügyfél 14 adatait szintén kizárták a helyi modellek átlagos általánosíthatóságának kiszámításából. a b 1 módszerek A kiegyensúlyozatlan kohorszokat használó helyi modellek (például többnyire enyhe COVID-19-es esetek) jelentősen előnyösek voltak az FL-megközelítésből, a kiszámítható átlagos AUC-teljesítmény jelentősen javult a csak néhány esettel rendelkező kategóriák esetében. Ez nyilvánvaló volt a kliens helyszínen 16 (egy kiegyensúlyozatlan adatkészlet), a legtöbb beteg enyhe betegség súlyosságát tapasztalva, és csak néhány súlyos esettel. Kiterjesztett adatfig. Még fontosabb, hogy az FL modell általánosíthatósága jelentősen megnőtt a helyi képzésben részesített modellnél. 3a 2 , ROC at client site 16, with unbalanced data and mostly mild cases. , ROC of the local model at client site 12 (a small dataset), mean ROC of models trained on larger datasets corresponding to the five client sites in the Boston area (1, 4, 5, 6, 8) and ROC of the best global model in prediction of 72-h oxygen treatment for different thresholds of EXAM score (left, middle, right). The mean ROC is calculated based on five locally trained models while the gray area denotes the ROC standard deviation. ROCs for three different cutoff values ( Pos és neg jelölik a pozitív és negatív esetek számát, respectively, a vizsga pontszámának ezen tartományában meghatározottak szerint. a b t In the case of client sites with relatively small datasets, the best FL model markedly outperformed not only the local model but also those trained on larger datasets from five client sites in the Boston area of the USA (Fig. ) az 3b A globális modell jól teljesített az oxigénszükséglet 24/72-es előrejelzésében mind a COVID-pozitív, mind a negatív betegeknél (Extended Data Fig. ) az 3 Validation at independent sites Following initial training, EXAM was subsequently tested at three independent validation sites: Cooley Dickinson Hospital (CDH), Martha’s Vineyard Hospital (MVH) and Nantucket Cottage Hospital (NCH), all in Massachusetts, USA. The model was not retrained at these sites and it was used only for validation purposes. The cohort size and model inference results are summarized in Table , and the ROC curves and confusion matrices for the largest dataset (from CDH) are shown in Fig. . The operating point was set to discriminate between nonmechanical ventilation and mechanical ventilation (MV) treatment (or death). The FL global trained model, EXAM, achieved an average AUC of 0.944 and 0.924 for 24- and 72-h prediction tasks, respectively (Table A 24 órás MV-kezelés (vagy halál) előrejelzése érdekében az EXAM 0,950-es érzékenységet és 0,882-es specifikusságot ért el a CDH-nál, valamint 1000-es specifikusságot az MVH-nál.Az NCH-nek 24 órán belül nem volt MV/halálos esete.A 72 órás MV-előrejelzés tekintetében az EXAM 0,929-es érzékenységet és 0,880-es specifikusságot ért el a CDH-nél, 1000-es érzékenységet és 0,976-os specifikusságot az MVH-nél, valamint 1000-es érzékenységet és 0,929-es specifikusságot ért el az NCH-nél. 2 4 2 , , teljesítmény (ROC) (felső) és zavaró mátrixok (alsó) az EXAM FL modelljét a CDH adatkészletben az oxigénszükséglet 24 órás előrejelzéséhez ( 24 órája ( ). ROCs for three different cutoff values ( ) of the EXAM risk score are shown. a b a b t For MV at CDH at 72 h, EXAM had a low false-negative rate of 7.1%. Representative failure cases are presented in Extended Data Fig. Két hamis-negatív esetet mutatott be a CDH-től, ahol az egyik esetben sok hiányzó EMR-adatok jellemzői voltak, a másikban pedig egy CXR volt, amelyben mozgás-artefaktum és néhány hiányzó EMR-funkció volt. 4 Differenciált magánélet A primary motivation for healthcare institutes to use FL is to preserve the security and privacy of their data, as well as adherence to data compliance measures. For FL, there remains the potential risk of model ‘inversion’ or even the reconstruction of training images from the model gradients themselves Ezeknek a kockázatoknak a leküzdése érdekében biztonsági intézkedéseket alkalmaztak annak érdekében, hogy csökkentsék a kockázatot az adatoknak a webhely-kiszolgáló kommunikáció során történő „elfogása” esetén. Olyan technikákkal kísérleteztünk, amelyek megakadályozzák az FL-adatok lehallgatását, és olyan biztonsági funkciót adtunk hozzá, amely szerintünk több intézményt ösztönözhet az FL használatára. A részleges súlymegosztási rendszer vizsgálata révén , , , kimutatták, hogy a modellek még akkor is elérhetik az összehasonlítható teljesítményt, ha a súlyfrissítések mindössze 25%-át osztják meg (Extended Data Fig. ). 47 48 49 50 50 51 52 5 Discussion This study features a large, real-world healthcare FL study in terms of number of sites and number of data points used. We believe that it provides a powerful proof-of-concept of the feasibility of using FL for fast and collaborative development of needed AI models in healthcare. Our study involved multiple sites across four continents and under the oversight of different regulatory bodies, and thus holds the promise of being provided to different regulated markets in an expedited way. The global FL model, EXAM, proved to be more robust and achieved better results at individual sites than any model trained on only local data. We believe that consistent improvement was achieved owing to a larger, but also a more diverse, dataset, the use of data inputs that can be standardized and avoidance of clinical impressions/reported symptoms. These factors played an important part in increasing the benefits from this FL approach and its impact on performance, generalizability and, ultimately, the model’s usability. Egy viszonylag kis adatkészletű ügyfélwebhely esetében két tipikus megközelítést lehetne használni egy hasznos modell összeállításához: az egyik a saját adataival történő helyi képzés, a másik a nagyobb adatkészleten képzett modell alkalmazása. Kis adatkészletű webhelyek esetében gyakorlatilag lehetetlenné vált volna egy teljesítőképes mélytanulási modellt létrehozni csak helyi adataik felhasználásával. Az a megállapítás, hogy ez a két megközelítés a globális FL modell által mindhárom előrejelzési feladatot felülmúlta, azt jelzi, hogy az FL együttműködésekben való részvételből eredő kis adatkészletű ügyfélwebhelyek előnye jelentős. Ez valószínűleg tükrözi az FL azon képességét, hogy a helyi képzésnél több sokszínűséget rögzít, és enyhítse a . 46 The validation results confirmed that the global model is robust, supporting our hypothesis that FL-trained models are generalizable across healthcare systems. They provide a compelling case for the use of predictive algorithms in COVID-19 patient care, and the use of FL in model creation and testing. By participating in this study the client sites received access to EXAM, to be further validated ahead of pursuing any regulatory approval or future introduction into clinical care. Plans are under way to validate EXAM prospectively in ‘production’ settings at MGB leveraging COVID-19 targeted resources , as well as at different sites that were not a part of the EXAM training. 53 Több mint 200 előrejelzési modellt publikáltak a COVID-19-es betegek döntéshozatalának támogatására . Unlike the majority of publications focused on diagnosis of COVID-19 or prediction of mortality, we predicted oxygen requirements that have implications for patient management. We also used cases with unknown SARS-COV-2 status, and so the model could provide input to the physician ahead of receiving a result for PCR with reverse transcription (RT–PCR), making it useful for a real-life clinical setting. The model’s imaging input is used in common practice, in contrast with models that use chest computed tomography, a nonconsensual diagnostic modality. The model’s design was constrained to objective predictors, unlike many published studies that leveraged subjective clinical impressions. The data collected reflect varied incidence rates, and thus the ‘population momentum’ we encountered is more diverse. This implies that the algorithm can be useful in populations with different incidence rates. 19 Patient cohort identification and data harmonization are not novel issues in research and data science A klinikai információs rendszerek fejlesztése szükséges az adatok előkészítésének egyszerűsítéséhez, ami a FL-ben részt vevő webhelyek hálózatának jobb kihasználásához vezet.Ez a hiperparaméter-technikával együtt lehetővé teszi az algoritmusok számára, hogy hatékonyabban „tanuljanak” a nagyobb adatkészletekből, és a modellparamétereket egy adott webhelyhez igazítsák a további személyre szabás érdekében – például a webhely további finomhangolása révén. . A system that would allow seamless, close-to real-time model inference and results processing would also be of benefit and would ‘close the loop’ from training to model deployment. 54 39 Because data were not centralized they are not readily accessible. Given that, any future analysis of the results, beyond what was derived and collected, is limited. Similar to other machine learning models, EXAM is limited by the quality of the training data. Institutions interested in deploying this algorithm for clinical care need to understand potential biases in the training. For example, the labels used as ground truth in the training of the EXAM model were derived from 24- and 72-h oxygen consumption in the patient; it is assumed that oxygen delivered to the patient equates the oxygen need. However, in the early phase of the COVID-19 pandemic, many patients were provided high-flow oxygen prophylactically regardless of their oxygen need. Such clinical practice could skew the predictions made by this model. Mivel az adatokhoz való hozzáférésünk korlátozott volt, a legtöbb helyszínen nem állt rendelkezésre elegendő információ a hibák okaira vonatkozó részletes statisztikák létrehozásához, utólagosan. mindazonáltal a legnagyobb független teszthely, a CDH hibás eseteit tanulmányoztuk, és olyan hipotéziseket tudtunk generálni, amelyeket a jövőben tesztelhetünk. A jövőben azt is meg kívánjuk vizsgálni, hogy a betegség progressziójának különböző fázisai miatt lehetséges-e a „populációcsökkenés”. Az egyik olyan funkció, amely fokozná az ilyen típusú nagyszabású együttműködést, az a képesség, hogy előre jelezzük az egyes ügyfélwebhelyek hozzájárulását a globális FL modell javításához. Ez segít az ügyfélwebhelyek kiválasztásában, valamint az adatgyűjtés és a jegyzetelési erőfeszítések prioritásában. Ez utóbbi különösen fontos a nagy konzorciumi erőfeszítések magas költségeinek és nehéz logisztikájának figyelembevételével, és lehetővé teszi ezeknek az erőfeszítéseknek a sokféleséget, nem pedig az adatminták nagyszámú mennyiségét. Future approaches may incorporate automated hyperparameter searching , neural architecture search Egyéb automatizált gépi tanulás megközelítések az egyes ügyfélwebhelyek optimális képzési paramétereinek hatékonyabb megtalálására. 55 56 57 Known issues of batch normalization (BN) in FL motivated us to fix our base model for image feature extraction to reduce the divergence between unbalanced client sites. Future work might explore different types of normalization techniques to allow the training of AI models in FL more effectively when client data are nonindependent and identically distributed. 58 49 Az FL-beállításon belüli adatvédelmi támadásokkal kapcsolatos közelmúltbeli munkák aggodalmakat vetettek fel a modellképzés során bekövetkezett adatszivárgás miatt . Meanwhile, protection algorithms remain underexplored and constrained by multiple factors. While differential privacy algorithms , , show good protection, they may weaken the model’s performance. Encryption algorithms, such as homomorphic encryption , maintain performance but may substantially increase message size and training time. A quantifiable way to measure privacy would allow better choices for deciding the minimal privacy parameters necessary while maintaining clinically acceptable performance , , . 59 36 48 49 60 36 48 49 Following further validation, we envision deployment of the EXAM model in the ED setting as a way to evaluate risk at both the per-patient and population level, and to provide clinicians with an additional reference point when making the frequently difficult task of triaging patients. We also envision using the model as a more sensitive population-level metric to help balance resources between regions, hospitals and departments. Our hope is that similar FL efforts can break the data silos and allow for faster development of much-needed AI models in the near future. Methods Ethics approval Az összes tájékozott Canyland Health Center-et a Toronto-i Egyetemes Egészségügyi Központ a Helsinki Nyilatkozatban és a Diego Nemzetközi Konferencia a Jó Klinikai Gyakorlatok Harmonizációjára vonatkozó iránymutatásokban meghatározott emberi kísérletezés elveivel összhangban vezették be, és a releváns intézményi felülvizsgálati testületek a következő érvényesítési helyeken: CDH, MVH, NCH és a következő képzési helyeken: MGB, Mass General Hospital (MGH), Brigham and Women’s Hospital, Newton-Wellesley Hospital, San Shore Public Medical Center és New Faulkner Hospital jóváhagyták (mind a nyolc ilyen kórházat a következő érvényesítési helyeken fedezték le: CDH, MVH, NCH és a következő képzési helyeken: 2020P00 MI-CLAIM guidelines for reporting of clinical AI models were followed (Supplementary Note ) 2 Tanulmányi beállítások A tanulmány 20 intézményből származó adatokat tartalmazott (fig. ): MGB, MGH, Brigham és Női Kórház, Newton-Wellesley Kórház, North Shore Orvosi Központ és Faulkner Kórház; National Children's Hospital Washington, DC; NIHR Cambridge Biomedical Research Center; The Self-Defense Forces Központi Kórház Tokióban; National Taiwan University MeDA Lab és MAHC és Taiwan National Health Insurance Administration; Tri-Service Általános Kórház Tajvan; Kyungpook Nemzeti Egyetemi Kórház Dél-Koreában; Orvostudományi Kar, Chulalongkorn Egyetem Thaiföldön; Diagnosticos da America SA Brazíliában; University of California, San Francisco; VA San Diego; University of Toronto; National Institutes of Health Bethesda, Maryland, Maryland; University of Wisconsin-Madison School , , Három független helyszín adatait használták független érvényesítésre: CDH, MVH és NCH, mindegyik Massachusettsben, USA-ban. Ez a három kórház a képzési helyszínektől eltérő betegpopulációs jellemzőkkel rendelkezett. 1a 61 62 63 Data collection The 20 client sites prepared a total of 16,148 cases (both positive and negative) for the purposes of training, validation and testing of the model (Fig. Az orvosi adatokat olyan betegek tekintetében keresték fel, akik megfeleltek a vizsgálatba való felvétel kritériumainak.Az ügyféloldalak arra törekedtek, hogy az összes COVID-pozitív esetet a pandémia kezdetétől, 2019 decemberétől egészen addig, amíg el nem kezdték a helyi képzést az EXAM-vizsgálatra.Az összes helyi képzés 2020. szeptember 30-ig megkezdődött.A helyszínek ugyanebben az időszakban más, negatív RT-PCR-teszt eredményekkel rendelkező betegeket is magukban foglaltak.Mivel a legtöbb helyszínen több SARS-COV-2-negatív, mint -pozitív beteg volt, a negatív betegek számát az egyes ügyféloldalak összes eseteinek legfeljebb 95%-ára korlátozták. 1b A ‘case’ included a CXR and the requisite data inputs taken from the patient’s medical record. A breakdown of the cohort size of the dataset for each client site is shown in Fig. . The distribution and patterns of CXR image intensity (pixel values) varied greatly among sites owing to a multitude of patient- and site-specific factors, such as different device manufacturers and imaging protocols, as shown in Fig. . Patient age and EMR feature distribution varied greatly among sites, as expected owing to the differing demographics between globally distributed hospitals (Extended Data Fig. ). 1b 1C és D 6 Betegek beilleszkedési kritériumai A betegek befogadására vonatkozó kritériumok a következők voltak: (1) a beteget a kórházi ED-nek vagy azzal egyenértékűnek mutatták be; (2) a beteg RT-PCR-tesztet végeztek az ED bemutatása és a kórházból való kilépés között bármikor; (3) a betegnek CXR-je volt az ED-ben; és (4) a beteg nyilvántartásában legalább öt EMR-érték szerepelt a táblázatban részletezettek között. Megjegyzendő, hogy a CXR, a laboratóriumi eredmények és a használt vitálok voltak az első, amelyek az ED látogatása során rendelkezésre álltak. 1 Bejárati modell Összesen 21 EMR-jellemzőt alkalmaztak a modellbe való belépésként.Az eredménycímkéket (azaz a földi igazságot) a betegek igényei alapján a kezdeti ED-be való felvételtől számított 24 és 72 óra elteltével osztották ki. . 1 The distribution of oxygen treatment using different devices at different client sites is shown in Extended Data Fig. , amely részletezi a készülék használatát az ED-be való belépéskor és a 24 és 72 órás időszakok után.Az adatkészletek eloszlásának különbségét a legnagyobb és a legkisebb ügyfélwebhelyek között az Extended Data Fig. . 7 8 The number of positive COVID-19 cases, as confirmed by a single RT–PCR test obtained at any time between presentation to the ED and discharge from the hospital, is listed in Supplementary Table . Each client site was asked to randomly split its dataset into three parts: 70% for training, 10% for validation and 20% for testing. For both 24- and 72-h outcome prediction models, random splits for each of the three repeated local and FL training and evaluation experiments were independently generated. 1 EXAM model development There is wide variation in the clinical course of patients who present to hospital with symptoms of COVID-19, with some experiencing rapid deterioration in respiratory function requiring different interventions to prevent or mitigate hypoxemia , A kezdeti ápolási ponton vagy az ED-ben a beteg értékelése során hozott kritikus döntés az, hogy a beteg valószínűleg invazívabb vagy erőforrás-korlátozott ellenintézkedéseket vagy beavatkozásokat igényel-e (például MV vagy monoklonális antitesteket), és ezért kevés, de hatékony terápiát, a mellékhatások miatt szűk kockázat-haszon arányú terápiát vagy magasabb szintű ellátást kell kapnia, mint például az intenzív osztályba való belépés. . In contrast, a patient who is at lower risk of requiring invasive oxygen therapy may be placed in a less intensive care setting such as a regular ward, or even released from the ED for continuing self-monitoring at home Az EXAM-et azért fejlesztették ki, hogy segítsen az ilyen betegek szűrésében. 62 63 64 65 Megjegyzendő, hogy a modellt jelenleg semmilyen szabályozó hatóság nem hagyta jóvá, és csak kutatási célokra kell használni. EXAM score EXAM was trained using FL; it outputs a risk score (termed EXAM score) similar to CORISK (Extended Data Fig. Ez megfelel a beteg oxigén-támogatási követelményeinek két ablakon belül - 24 és 72 óra - az ED-nek való első bemutatása után. bemutatja, hogy a CORISK és a vizsga pontszám hogyan használható a betegek szűrésére. 27 9a 9b A mellkasi röntgenképeket előre feldolgozták, hogy kiválasszák az elülső helyzetképet, és kizárják az oldalsó nézetképeket, majd 224 × 224 felbontásra skálázzák. , a modell egyesíti az EMR és a CXR funkciókból származó információkat (módosított ResNet34-en alapul, térbeli figyelmet fordítva pretrained on the CheXpert dataset) Deep & Cross hálózat A különböző adattípusok konvergenciájához egy 512-dimenziós funkcióvektor került kivonásra minden egyes CXR-képből egy előre képzett ResNet34 segítségével, térbeli figyelemmel, majd összekapcsolva az EMR-funkciókkal a Deep & Cross hálózat bemeneteként. A veszteség funkciójaként keresztentrópiát és az optimalizálóként az „Ádámot” használtuk. using the NVIDIA Clara Train SDK . The average AUC for the classification tasks (≥LFO, ≥HFO/NIV or ≥MV) was calculated and used as the final evaluation metric, with normalization to zero-mean and unit variance. CXR images were preprocessed to select the correct series and exclude lateral view images, then scaled to a resolution of 224 × 224 (ref. ) az 9a 66 67 68 9b 69 70 27 Az imputáció és a normalizáció A MissForest algoritmus Ha egy EMR-funkció teljesen hiányzott egy kliens-webhely-adatkészletből, a funkció átlagértéke, amelyet kizárólag az MGB-kliens-webhelyek adatairól számítottak, felhasználásra került. 71 Details of EMR–CXR data fusion using the Deep & Cross network Az EMR- és CXR-adatokból származó funkciók interakcióinak modellezésére esettanulmányi szinten a Deep & Cross hálózati architektúrán alapuló mélyfunkciós sémát alkalmaztak. . Binary and categorical features for the EMR inputs, as well as 512-dimensional image features in the CXR, were transformed into fused dense vectors of real values by embedding and stacking layers. The transformed dense vectors served as input to the fusion framework, which specifically employed a crossing network to enforce fusion among input from different sources. The crossing network performed explicit feature crossing within its layers, by conducting inner products between the original input feature and output from the previous layer, thus increasing the degree of interaction across features. At the same time, two individual classic deep neural networks with several stacked, fully connected feed-forward layers were trained. The final output of our framework was then derived from the concatenation of both classic and crossing networks. 68 FL details Talán az FL legelterjedtebb formája a McMahan et al. által javasolt szövetségi átlag algoritmus végrehajtása. , vagy annak variációi. Ez az algoritmus megvalósítható egy kliens-kiszolgáló beállítással, ahol minden részt vevő webhely kliensként működik. Az FL-t egy olyan módszernek lehet tekinteni, amelynek célja a globális veszteségfunkció minimalizálása azáltal, hogy az egyes webhelyeken becsült helyi veszteségfunkciókat csökkenti. Az egyes kliens-webhelyek helyi veszteségének minimalizálásával, miközben a megtanult kliens-webhely súlyait egy központosított aggregációs szerveren szinkronizálják, minimalizálhatjuk a globális veszteséget anélkül, hogy hozzáférnünk kellene a teljes adatkészlethez egy központosított helyen. Minden kliens-webhely helyi szinten tanul, és megosztja a modelltömeg-fr ) az 72 9c Az FL pseudoalgoritmusa a Kiegészítő megjegyzésben látható Kísérletünkben a szövetségi körök számát a = 200, egy helyi képzési időszakonként Az ügyfelek száma, az ügyfelek száma, , az ügyfelek hálózati kapcsolatától vagy a rendelkezésre álló adatoktól függően legfeljebb 20 volt egy adott célzott kimeneti időszakra (24 vagy 72 óra). , az egyes ügyfelek adatkészletének méretétől függ és az egyes ügyfelek hozzájárulásainak súlyozására használják a modell súlyainak egyesített átlagban történő összesítésekor.Az FL képzési feladat során minden ügyfélwebhely kiválasztja a legjobb helyi modellt a modell teljesítményének helyi validációs készletén történő nyomon követésével.Egyidejűleg a szerver meghatározza a legjobb globális modellt az egyes ügyfélwebhelyekről a szerverre küldött átlagos validációs pontszámok alapján.Az FL képzés befejezése után a legjobb helyi modelleket és a legjobb globális modellt automatikusan megosztják az összes ügyfélwebhelygel, és értékelik a helyi tesztadatok alapján. 1 T t K Az NK k Az Adam optimalizálót mind a helyi képzésre, mind az FL-re használták, kezdeti tanulási arányuk 5 × 10–5 volt, és a tanulási arány fokozatos lebomlása minden 40 korszak után 0,5 faktorral, ami fontos a szövetségi átlagok konvergenciájához. . Random affine transformations, including rotation, translations, shear, scaling and random intensity noise and shifts, were applied to the images for data augmentation during training. 73 A BN rétegek érzékenységének köszönhetően Amikor különböző ügyfelekkel foglalkoztunk egy nem független és azonos módon elosztott környezetben, úgy találtuk, hogy a legjobb modellteljesítmény akkor következett be, amikor az előre képzett ResNet34-et térbeli figyelmet szenteltük. Az EMR funkciókkal kombináló Deep & Cross hálózat nem tartalmaz BN réteget, ezért a BN instabilitási problémák nem érintik. 58 47 In this study we investigated a privacy-preserving scheme that shares only partial model updates between server and client sites. The weight updates were ranked during each iteration by magnitude of contribution, and only a certain percentage of the largest weight updates was shared with the server. To be exact, weight updates (also known as gradients) were shared only if their absolute value was above a certain percentile threshold, (t) (Extended Data Fig. ), which was computed from all non-zero gradients, Δ Minden ügyfél számára eltérő lehet Minden FL körben Ennek a rendszernek a variációi magukban foglalhatják a nagy gradiensek vagy a differenciális adatvédelmi rendszerek további vágását. amelyek véletlenszerű zajt adnak a gradiensekhez, vagy akár a nyers adatokhoz, mielőtt a hálózatba kerülnének . k 5 Kb(t) k t 49 51 Statistical analysis Végeztünk egy Wilcoxon aláírt rangsor tesztet, hogy megerősítsük a megfigyelt teljesítménynövekedés jelentőségét a helyileg képzett modell és az FL modell között a 24 és 72 órás időpontok tekintetében (Fig. Kiterjesztett adatfig. A nullhipotézist egyoldalúan elutasították. « 1 × 10–3 in both cases. 2 1 P A Pearson-korrelációt arra használták, hogy értékeljék a helyi adatkészlet méretével összefüggésben a helyi képzett modellek általánosíthatóságát (az átlagos AUC értéknek a többi ügyfélwebhely tesztadataival való robusztusságát). = 0.43, = 0,035, szabadságfok (df) = 17 a 24 órás modell és Azaz 0,62 = 0.003, df = 16 for the 72-h model). This indicates that dataset size alone is not the only factor determining a model’s robustness to unseen data. r P r P A globális FL modellből származó ROC görbék és a különböző helyszíneken képzett helyi modellek összehasonlítása (Extended Data Fig. ), 1000 mintát indítottunk az adatokból, és kiszámítottuk a kapott AUC-t. Ezután kiszámítottuk a két sorozat közötti különbséget, és a képlet segítségével szabványosítottuk = (AUC1 és AUC2) Ahol a szabványosított különbség, a bootstrap-különbségek standard eltérése, és az AUC1 és az AUC2 a megfelelő bootstrapped AUC-sorozat. A normál eloszlással megkaptuk a values illustrated in Supplementary Table . The results show that the null hypothesis was rejected with very low értékek, jelezve a statisztikai jelentőségét a felsőbbrendűségét FL eredmények. values was conducted in R with the pROC library . 3 D s D s D P 2 P P 74 Since the model predicts a discrete outcome, a continuous score from 0 to 1, a straightforward calibration evaluation such as a qqplot is not possible. Hence, for a quantified estimate of calibration we quantified discrimination (Extended Data Fig. ). We conducted one-way analysis of variation (ANOVA) tests to compare local and FL model scores among four ground truth categories (RA, LFO, HFO, MV). The A statisztikát úgy számították ki, hogy a minta közötti változás a mintán belüli változással oszlik meg, és a különböző csoportok közötti diszperzió mértékét képviseli, a modellek számszerűsítésére használták. - öt különböző helyi helyszín értékei 245.7, 253.4, 342.3, 389.8 és 634.8, míg az FL modell értékei 843.5. -értékek azt jelentenek, hogy a csoportok szétválaszthatóbbak, az FL modellből származó pontszámok egyértelműen nagyobb diszperziót mutatnak a négy alapvető igazságkategória között. value of the ANOVA test on the FL model is <2 × 10–16, indicating that the FL prediction scores are statistically significantly different among the different prediction classes. 10 F F F P Összefoglaló jelentés Further information on research design is available in the linked to this article. Természettudományi jelentés összefoglalója Adatok rendelkezésre állása The dataset from the 20 institutes that participated in this study remains under their custody. These data were used for training at each of the local sites and were not shared with any of the other participating institutions or with the federated server, and they are not publicly available. Data from the independent validation sites are maintained by CAMCA, and access can be requested by contacting Q.L. Based on determination by CAMCA, a data-sharing review and amendment of IRB for research purposes can be conducted by MGB research administration and in accordance with MGB IRB and policy. Kód elérhetőség A tanulmányban használt összes kód és szoftver nyilvánosan elérhető az NGC-n. A hozzáféréshez, a vendégként való bejelentkezéshez vagy a profil létrehozásához adja meg az alábbi URL-címek egyikét.A képzett modellek, az adatkészítési irányelvek, a képzési kódok, a modell validálási tesztelése, a readme fájl, a telepítési irányelvek és a licencfájlok nyilvánosan elérhetők az NVIDIA NGC-n A következő: A szövetséges tanulási szoftver a Clara Train SDK részeként érhető el: . Alternatively, use this command to download the model “wget --content-disposition -O clara_train_covid19_exam_ehr_xray_1.zip » 61 https://ngc.nvidia.com/catalog/models/nvidia:med:clara_train_covid19_exam_ehr_xray https://ngc.nvidia.com/catalog/containers/nvidia:clara-train-sdk https://api.ngc.nvidia.com/v2/models/nvidia/med/clara_train_covid19_exam_ehr_xray/versions/1/zip Referenciák Budd, J. et al. Digital technologies in the public-health response to COVID-19. , 1183–1192 (2020). Nat. Med. 26 Moorthy, V., Henao Restrepo, A. M., Preziosi, M.-P. & Swaminathan, S. Data sharing for novel coronavirus (COVID-19). , 150 (2020). Bull. World Health Organ. 98 Chen, Q., Allot, A. & Lu, Z. Keep up with the latest coronavirus research. , 193 (2020). Nature 579 Fabbri, F., Bhatia, A., Mayer, A., Schlotter, B. & Kaiser, J. BCG IT spend pulse: how COVID-19 is shifting tech priorities. (2020). https://www.bcg.com/publications/2020/how-covid-19-is-shifting-big-it-spend Candelon, F., Reichert, T., Duranton, S., di Carlo, R. C. & De Bondt, M. The rise of the AI-powered company in the postcrisis world. (2020). https://www.bcg.com/en-gb/publications/2020/business-applications-artificial-intelligence-post-covid Chao, H. et al. Integrative analysis for COVID-19 patient outcome prediction. , 101844 (2021). Med. Image Anal. 67 Zhu, X. et al. Joint prediction and time estimation of COVID-19 developing severe symptoms using chest CT scan. , 101824 (2021). Med. Image Anal. 67 Yang, D. et al. Federated semi-supervised learning for Covid region segmentation in chest ct using multi-national data from China, Italy, Japan. , 101992 (2021). Med. Image Anal. 70 Minaee, S., Kafieh, R., Sonka, M., Yazdani, S. & Jamalipour Soufi, G. Deep-COVID: predicting COVID-19 from chest X-ray images using deep transfer learning. , 101794 (2020). Med. Image Anal. 65 COVID-19 Studies from the World Health Organization Database. (2020). https://clinicaltrials.gov/ct2/who_table ACTIV. (2020). https://www.nih.gov/research-training/medical-research-initiatives/activ Coronavirus Treatment Acceleration Program (CTAP). US Food and Drug Administration (2020). https://www.fda.gov/drugs/coronavirus-covid-19-drugs/coronavirus-treatment-acceleration-program-ctap Gleeson, P., Davison, A. P., Silver, R. A. & Ascoli, G. A. A commitment to open source in neuroscience. , 964–965 (2017). Neuron 96 Piwowar, H. et al. The state of OA: a large-scale analysis of the prevalence and impact of open access articles. , e4375 (2018). PeerJ. 6 European Society of Radiology (ESR). What the radiologist should know about artificial intelligence – an ESR white paper. , 44 (2019). Insights Imaging 10 Pesapane, F., Codari, M. & Sardanelli, F. Artificial intelligence in medical imaging: threat or opportunity? Radiologists again at the forefront of innovation in medicine. , 35 (2018). Eur. Radiol. Exp. 2 Price, W. N. 2nd & Cohen, I. G. Privacy in the age of medical big data. , 37–43 (2019). Nat. Med. 25 Liang, W. et al. Development and validation of a clinical risk score to predict the occurrence of critical illness in hospitalized patients with COVID-19. , 1081–1089 (2020). JAMA Intern. Med. 180 Wynants, L. et al. Prediction models for diagnosis and prognosis of covid-19 infection: systematic review and critical appraisal. , m1328 (2020). Brit. Med. J. 369 Zhang, L. et al. D-dimer levels on admission to predict in-hospital mortality in patients with Covid-19. , 1324–1329 (2020). J. Thromb. Haemost. 18 Sands, K. E. et al. Patient characteristics and admitting vital signs associated with coronavirus disease 2019 (COVID-19)-related mortality among patients admitted with noncritical illness. (2020). https://doi.org/10.1017/ice.2020.461 American College of Radiology. CR recommendations for the use of chest radiography and computed tomography (CT) for suspected COVID-19 infection. (2020). https://www.acr.org/Advocacy-and-Economics/ACR-Position-Statements/Recommendations-for-Chest-Radiography-and-CT-for-Suspected-COVID19-Infection Rubin, G. D. et al. The role of chest imaging in patient management during the COVID-19 pandemic: a multinational consensus statement from the Fleischner Society. , 172–180 (2020). Radiology 296 World Health Organization. Use of chest imaging in COVID-19. (2020). https://www.who.int/publications/i/item/use-of-chest-imaging-in-covid-19 Jamil, S. et al. Diagnosis and management of COVID-19 disease. , 10 (2020). Am. J. Respir. Crit. Care Med. 201 Redmond, C. E., Nicolaou, S., Berger, F. H., Sheikh, A. M. & Patlas, M. N. Emergency radiology during the COVID-19 pandemic: The Canadian Association of Radiologists Recommendations for Practice. , 425–430 (2020). Can. Assoc. Radiologists J. 71 Buch, V. et al. Development and validation of a deep learning model for prediction of severe outcomes in suspected COVID-19 Infection. Preprint at (2021). https://arxiv.org/abs/2103.11269 Lyons, C. & Callaghan, M. The use of high-flow nasal oxygen in COVID-19. , 843–847 (2020). Anaesthesia 75 Whittle, J. S., Pavlov, I., Sacchetti, A. D., Atwood, C. & Rosenberg, M. S. Respiratory support for adult patients with COVID-19. , 95–101 (2020). J. Am. Coll. Emerg. Physicians Open 1 Ai, J., Li, Y., Zhou, X. & Zhang, W. COVID-19: treating and managing severe cases. , 370–371 (2020). Cell Res. 30 Esteva, A. et al. A guide to deep learning in healthcare. , 24–29 (2019). Nat. Med. 25 Cahan, E. M., Hernandez-Boussard, T., Thadaney-Israni, S. & Rubin, D. L. Putting the data before the algorithm in big data addressing personalized healthcare. , 78 (2019). NPJ Digit. Med. 2 Thrall, J. H. et al. Artificial intelligence and machine learning in radiology: opportunities, challenges, pitfalls, and criteria for success. , 504–508 (2018). J. Am. Coll. Radiol. 15 Shilo, S., Rossman, H. & Segal, E. Axes of a revolution: challenges and promises of big data in healthcare. , 29–38 (2020). Nat. Med. 26 Gao, Y. & Cui, Y. Deep transfer learning for reducing health care disparities arising from biomedical data inequality. , 5131 (2020). Nat. Commun. 11 Rieke, N. et al. The future of digital health with federated learning. , 119 (2020). NPJ Dig. Med. 3 Yang, Q., Liu, Y., Chen, T. & Tong, Y. Federated machine learning: concept and applications. , 12 (2019). ACM Trans. Intell. Syst. Technol. 10 Ma, C. et al. On safeguarding privacy and security in the framework of federated learning. , 242–248 (2020). IEEE Netw. 34 Brisimi, T. S. et al. Federated learning of predictive models from federated Electronic Health Records. , 59–67 (2018). Int. J. Med. Inform. 112 Roth, H. R. et al. Federated learning for breast density classification: a real-world implementation. In , (eds. Albarqouni, S. et al.) Vol. 12,444, 181–191 (Springer International Publishing, 2020). Proc. Second MICCAI Workshop, DART 2020 and First MICCAI Workshop, DCL 2020 Domain Adaptation and Representation Transfer, and Distributed and Collaborative Learning Sheller, M. J. et al. Federated learning in medicine: facilitating multi-institutional collaborations without sharing patient data. , 12598 (2020). Sci. Rep. 10 Remedios, S. W., Butman, J. A., Landman, B. A. & Pham, D. L. in (eds Remedios, S. W. et al.) (Springer, 2020). Federated Gradient Averaging for Multi-Site Training with Momentum-Based Optimizers Xu, Y. et al. A collaborative online AI engine for CT-based COVID-19 diagnosis. Preprint at (2020). https://www.medrxiv.org/content/10.1101/2020.05.10.20096073v2 Raisaro, J. L. et al. SCOR: A secure international informatics infrastructure to investigate COVID-19. , 1721–1726 (2020). J. Am. Med. Inform. Assoc. 27 Vaid, A. et al. Federated learning of electronic health records to improve mortality prediction in hospitalized patients with COVID-19: machine learning approach. , e24207 (2021). JMIR Med. Inform. 9 Nino, G. et al. Pediatric lung imaging features of COVID-19: a systematic review and meta-analysis. , 252–263 (2021). Pediatr. Pulmonol. 56 Fredrikson, M., Jha, S. & Ristenpart, T. Model inversion attacks that exploit confidence information and basic countermeasures. In 1322–1333, (2015). Proc. 22nd ACM SIGSAC Conference on Computer and Communications Security https://doi.org/10.1145/2810103.2813677 Zhu, L., Liu, Z. & Han, S. in (eds Wallach, H. et al.) 14774–14784 (Curran Associates, Inc., 2019). Advances in Neural Information Processing Systems 32 Kaissis, G. A., Makowski, M. R., Rückert, D. & Braren, R. F. Secure, privacy-preserving and federated machine learning in medical imaging. , 305–311 (2020). Nat. Mach. Intell. 2 Li, W. et al. in 133–141 (Springer, 2019). Privacy-Preserving Federated Brain Tumour Segmentation Shokri, R. & Shmatikov, V. Privacy-preserving deep learning. In (2015). Proc. 53rd Annual Allerton Conference on Communication, Control, and Computing (Allerton) https://doi.org/10.1109/allerton.2015.7447103 Li, X. et al. Multi-site fMRI analysis using privacy-preserving federated learning and domain adaptation: ABIDE results. , 101765 (2020). Med. Image Anal. 65 Estiri, H. et al. Predicting COVID-19 mortality with electronic medical records. , 15 (2021). NPJ Dig. Med. 4 Jiang, G. et al. Harmonization of detailed clinical models with clinical study data standards. , 65–74 (2015). Methods Inf. Med. 54 Yang, D. et al. in . (2019). Searching Learning Strategy with Reinforcement Learning for 3D Medical Image Segmentation https://doi.org/10.1007/978-3-030-32245-8_1 Elsken, T., Metzen, J. H. & Hutter, F. Neural architecture search: a survey. , 1–21 (2019). J. Mach. Learning Res. 20 Yao, Q. et al. Taking human out of learning applications: a survey on automated machine learning. Preprint at (2019). https://arxiv.org/abs/1810.13306 Ioffe, S. & Szegedy, C. Batch normalization: accelerating deep network training by reducing internal covariate shift. In , PMLR , 448–456 (2015). Proc. 32nd International Conf. Machine Learning 37 Kaufman, S., Rosset, S. & Perlich, C. Leakage in data mining: formulation, detection, and avoidance. In , 556–563 (2011). Proc. 17th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining Zhang, C. et al. BatchCrypt: efficient homomorphic encryption for cross-silo federated learning. In , 493–506 (2020). Proc. 2020 USENIX Annual Technical Conference, ATC 2020 . (2020). Nvidia NGC Catalog: COVID-19 Related Models https://ngc.nvidia.com/catalog/models?orderBy=scoreDESC&pageNumber=0&query=covid&quickFilter=models&filters Marini, J. J. & Gattinoni, L. Management of COVID-19 respiratory distress. , 2329–2330 (2020). JAMA 323 Cook, T. M. et al. Consensus guidelines for managing the airway in patients with COVID-19: Guidelines from the Difficult Airway Society, the Association of Anaesthetists the Intensive Care Society, the Faculty of Intensive Care Medicine and the Royal College of Anaesthetist. , 785–799 (2020). Anaesthesia 75 Galloway, J. B. et al. A clinical risk score to identify patients with COVID-19 at high risk of critical care admission or death: an observational cohort study. , 282–288 (2020). J. Infect. 81 Kilaru, A. S. et al. Return hospital admissions among 1419 COVID-19 patients discharged from five U.S. emergency departments. , 1039–1042 (2020). Acad. Emerg. Med. 27 He, K., Zhang, X., Ren, S. & Sun, J. Deep residual learning for image recognition. In (2016). Proc. 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR) https://doi.org/10.1109/cvpr.2016.90 Irvin, J. et al. CheXpert: a large chest radiograph dataset with uncertainty labels and expert comparison. , 590–597 (2019). Proc. AAAI Conf. Artif. Intell. 33 Wang, R., Fu, B., Fu, G. & Wang, M. Deep & Cross network for Ad Click predictions. In Article no. 12 (2017). Proc. ADKDD’17 Abadi, M. et al. TensorFlow: asystem for large-scale machine learning. In , USENIX Association 265–283 (2016). 12th USENIX Symposium on Operating Systems Design and Implementation (OSDI 16) . (2020). NVIDIA Clara Imaging https://developer.nvidia.com/clara-medical-imaging Stekhoven, D. J. & Bühlmann, P. MissForest–non-parametric missing value imputation for mixed-type data. , 112–118 (2012). Bioinformatics 28 McMahan, H., Moore, E., Ramage, D., Hampson, S. & y Arcas, B. A. Communication-efficient learning of deep networks from decentralized data. (2017). http://proceedings.mlr.press/v54/mcmahan17a.html Hsieh, K., Phanishayee, A., Mutlu, O. & Gibbons, P. B. The non-IID data quagmire of decentralized machine learning. In PMLR 119 (2020). Proc. 37th International Conf. Machine Learning Robin, X. et al. pROC: an open-source package for R and S+ to analyze and compare ROC curves. , 77 (2011). BMC Bioinformatics 12 elismerések Az ügyfélmunka megjegyzi, hogy ez a tanulmány a szerzők, és nem feltétlenül az NHS, a NIHR, a Department of Health and Social Care, vagy bármely a szervezetek társult a szerzők. MGB köszönet a következő személyek támogatásáért: J. Brink, Department of Radiology, Massachusetts General Hospital, Harvard Medical School, Boston, MA; M. Kalra, Department of Radiology, Massachusetts General Hospital, Harvard Medical School, Boston, MA; N. Neumark, Center for Clinical Data Science, Massachusetts General Brigham, Boston, MA; T. Schultz, Department of Radiology, Massachusetts General Hospital, Boston, MA; N. Guo, Center for Advanced Medical Computing and Analysis, Department of Radiology, Massachusetts General Hospital, Harvard Medical School, Boston, MA; MA J. K. Cramer, igazgató, Az Orvostudományi Karon keresztül a Chulalongkorn Egyetem megköszönte a Ratchadapisek Sompoch Endowment Fund RA (PO) (No. 001/63) a COVID-19-hez kapcsolódó klinikai adatok és biológiai minták gyűjtését és kezelését a Kutatási Task Force, Orvostudományi Kar, Chulalongkorn Egyetem számára. NIHR Cambridge Biomedical Research Center megköszönte A. Priest-t, akit a NIHR (Cambridge Biomedical Research Centre at Cambridge University Hospitals NHS Foundation Trust) támogat. Nemzeti Tajvani Egyetem MeDA Lab és a MAHC és a Tajvani Nemzeti Egészségbiztosítási Igazgatóság megköszönte a MOST Közös Kutatóközpontot az AI technológiáért, az All Vista Egészség https://data.ucsf.edu/covid19 Ez a dokumentum a CC by 4.0 Deed (Attribution 4.0 International) licenc alatt áll rendelkezésre. Ez a dokumentum a CC by 4.0 Deed (Attribution 4.0 International) licenc alatt áll rendelkezésre.