Autori : Ittai Dayan Holger R. Roth Aoxiao Zhong Ahmed Harouni Amilcare Gentili Anas Z. Abidin Andrew Liu Anthony Beardsworth Costa Bradford J. Wood Chien-Sung Tsai Chih-Hung Wang Chun-Nan Hsu C. K. Lee Peiying Ruan Daguang Xu Dufan Wu Eddie Huang Felipe Campos Kitamura Griffin Lacey Gustavo César de Antônio Corradi Gustavo Nino Hao-Hsin Shin Hirofumi Obinata Hui Ren Jason C. Crane Jesse Tetreault Jiahui Guan John W. Garrett Joshua D. Kaggie Jung Gil Park Keith Dreyer Krishna Juluru Kristopher Kersten Marcio Aloisio Bezerra Cavalcanti Rockenbach Marius George Linguraru Masoom A. Haider Meena AbdelMaseeh Nicola Rieke Pablo F. Damasceno Pedro Mario Cruz e Silva Pochuan Wang Sheng Xu Shuichi Kawano Sira Sriswasdi Soo Young Park Thomas M. Grist Varun Buch Watsamon Jantarabenjakul Weichung Wang Won Young Tak Xiang Li Xihong Lin Young Joon Kwon Abood Quraini Andrew Feng Andrew N. Priest Baris Turkbey Benjamin Glicksberg Bernardo Bizzo Byung Seok Kim Carlos Tor-Díez Chia-Cheng Lee Chia-Jung Hsu Chin Lin Chiu-Ling Lai Christopher P. Hess Colin Compas Deepeksha Bhatia Eric K. Oermann Evan Leibovitz Hisashi Sasaki Hitoshi Mori Isaac Yang Jae Ho Sohn Krishna Nand Keshava Murthy Li-Chen Fu Matheus Ribeiro Furtado de Mendonça Mike Fralick Min Kyu Kang Mohammad Adil Natalie Gangai Peerapon Vateekul Pierre Elnajjar Sarah Hickman Sharmila Majumdar Shelley L. McLeod Sheridan Reed Stefan Gräf Stephanie Harmon Tatsuya Kodama Thanyawee Puthanakit Tony Mazzulli Vitor Lima de Lavor Yothin Rakvongthai Yu Rim Lee Yuhong Wen Fiona J. Gilbert Mona G. Flores Quanzheng Li Autori : Itālijā Holgers R. Roths Aoxiao Žong Ahmeds Harouni Amilcare draudzīgi Anas Z. Abidīns Andrejs Liu Anthony Beardsworth Kosta Bradford J. Vuds Ķēniņ-Sung Tsai Chih-Hung Wang pārstāvis Chun-Nan Hsu izstāde C. K. Lī Rūdolfs Rūdolfs Dāvids Xu Dāvids Wu Edvīns Huans Felipe Campos Kitāmura Grifins Lācis Gustavs Cēzars de Antônio Corradi Gustavs Nīmanis Hao-Hsin Shin Hirofumi Obinata Hui Ren Džeisons C. Krains Džeisijs Tetreauts Jiahui Guan Džons V. Gārnts Džošua D. Kagija Jung Gil parks Keita Dreijere Krishna Jūlija Kristīne Krūmiņa Marcio Aloisio Bezerra Cavalcanti Rokenbači Marius Džordžs Linguraru Masooms A. Haiders Meena Abdelmaseeh Nikolaja Riekstiņa Pablo F. Damasceno Pedro Mario Cruz un Silva Pēteris Wang Šengs Xu Šūjiši Kawano Sērija Sirsniņa Soo Young parks Toms M. Grīns Vārda grāmata Vakariņas Ūdensvīrs Vērša kungs Jaunais tak Ķīnas Li Džūlija Lin Jaunais Džons Kvons Lāčplēsis Kurainis Andrejs Fengs Andrejs N. Priests Mārtiņš Turks Benjamins Gliksbergs Bernards Bizzo Iepazīšanās ar Kim Kārlis Tor-Dīzs Chia-čeng li Chia-Jung Hsu izstāde Ķīna Lin Chiu-Ling Lai Kristofers P. Hess Kolins Kompas Deepeksha Bhatia Ēriks K. Oermans Evan Leibovičs Hisaši Sasaki Hitoshi Mori Isaaks Jansons Jae Ho dēls Krishna Nanda un Keshava Murthy Li-Čen Fu Matheus Ribeiro Furtado de Mendonça izstāde Maiks Fraliks Mīlestība Kyu Kang Muhameds Adils Natālija Gangai Pēteris Vācietis Pierre Elnajjar Sarah Hickman uzstāšanās Šarmila Majumdar Šēlijs L. Maklīds Šerijs Reids Stīvens Grāfs Stefanija Harmon Tatsuya Kodama Mīļie putniņi Tonija Mazulīte Vitor Lima no darba Jēkabpils rajona tiesa Yu Rim Lī Mārtiņš Wen Fiona J. Gilberta Mona G. Ziedi Lielais Li Abstraktā Federētā mācīšanās (FL) dati ir metode, ko izmanto, lai apmācītu mākslīgā intelekta modeļus ar datiem no vairākiem avotiem, vienlaikus saglabājot datu anonimitāti, tādējādi novēršot daudzus šķēršļus datu apmaiņai. Šeit mēs izmantojām datus no 20 institūtiem visā pasaulē, lai apmācītu FL modeli, ko sauc par EXAM (elektronisko medicīnisko ierakstu (EMR) krūšu X-ray AI modeli), kas paredz nākotnes skābekļa prasības simptomātiskiem pacientiem ar COVID-19, izmantojot dzīvības pazīmju ievadi, laboratorijas datus un krūšu rentgena starus. EXAM sasniedza vidējo platību zem līknes (AUC) > 0,92 rezultātu prognozēšanai 24 un 72 Galvenais Zinātniskās, akadēmisko, medicīnas un datu zinātnes kopienas ir sapulcējušās COVID-19 pandēmijas krīzes priekšā, lai ātri novērtētu jaunas paradigmas mākslīgā intelekta (AI) jomā, kas ir ātras un drošas, un potenciāli veicinātu datu koplietošanu un modeļu apmācību un testēšanu bez parastajiem privātuma un datu īpašumtiesību šķēršļiem parastās sadarbības. , Veselības aprūpes sniedzēji, pētnieki un rūpniecība ir novirzījuši savu uzmanību, lai risinātu krīzes radītās neatbilstīgās un kritiskās klīniskās vajadzības, ar ievērojamiem rezultātiem. , , , , , , Klīnisko izmēģinājumu pieņemšanu ir paātrinājušas un atvieglojušas valstu regulatīvās iestādes un starptautiska sadarbība. , , Datu analīzes un AI disciplīnas vienmēr ir veicinājušas atvērtas un sadarbspējīgas pieejas, aptverot tādas koncepcijas kā atvērtā koda programmatūra, reproducējami pētījumi, datu repozitoriji un anonimizētu datu kopumu publiskošana. , Pandēmija ir uzsvērusi nepieciešamību steidzami veikt datu sadarbību, kas sniedz iespēju klīniskajām un zinātniskajām kopienām, reaģējot uz strauji mainīgajiem un plaši izplatītajiem globālajiem izaicinājumiem. , , . 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 Konkrēts šāda veida sadarbības piemērs ir mūsu iepriekšējais darbs ar AI balstītu klīnisko lēmumu atbalsta (CDS) modeli SARS-COV-2. Šis CDS modelis tika izstrādāts Mass General Brigham (MGB) un tika validēts vairākās veselības sistēmās. , , , CXR tika izvēlēts kā attēlveidošanas izeja, jo tas ir plaši pieejams un parasti norādīts ar vadlīnijām, piemēram, ACR Fleischner sabiedrība Kas ir WHO Toraču nacionālās sabiedrības Nacionālā veselības ministrija COVID rokasgrāmatas un radioloģijas biedrības visā pasaulē CDS modeļa iznākums bija rezultāts, ko sauc par CORISK , kas atbilst skābekļa atbalsta prasībām un kas varētu palīdzēt pacientu pārbaudīšanā no frontes klīnikas , , Ir zināms, ka veselības aprūpes sniedzēji dod priekšroku modeļiem, kas tika validēti pēc saviem datiem. Līdz šim lielākā daļa AI modeļu, tostarp iepriekš minētais CDS modelis, ir apmācīti un validēti uz “sausiem” datiem, kuriem bieži trūkst daudzveidības. , Tas var tikt mazināts, apmācot dažādus datus no vairākām vietnēm bez datu centralizācijas Izmantojot tādas metodes kā apmācība , vai FL. FL ir metode, ko izmanto, lai apmācītu AI modeļus dažādos datu avotos, neizmantojot datus, kas tiek transportēti vai eksponēti ārpus to sākotnējās atrašanās vietas. . 18 19 20 21 22 23 24 25 26 27 28 29 30 27 31 32 33 34 35 36 Federētā mācīšanās atbalsta centralizēti orķestrētu eksperimentu ātru uzsākšanu, uzlabojot datu izsekojamību un novērtējot algoritmiskās izmaiņas un ietekmi Viena pieeja FL, ko sauc par klientu-serveru, nosūta “neapmācītu” modeli citiem serveriem (“nodes”), kas veic daļējus apmācības uzdevumus, savukārt nosūta rezultātus atpakaļ, lai tos apvienotu centrālajā (“federētajā”) serverī. . 37 36 FL datu pārvaldība tiek uzturēta lokāli, atvieglojot privātuma bažas, un starp klientu vietnēm un federēto serveri tiek komunicēti tikai modeļa svari vai gradienti , FL jau ir parādījis solījumu nesenajās medicīnas attēlveidošanas lietojumprogrammās , , , COVID-19 analīze , , Ievērojams piemērs ir mirstības prognozēšanas modelis pacientiem, kas inficēti ar SARS-COV-2, kas izmanto klīniskos raksturlielumus, lai gan ierobežots modeļu skaita un mēroga ziņā. . 38 39 40 41 42 43 8 44 45 46 Mūsu mērķis bija izstrādāt stingru, vispārināmu modeli, kas varētu palīdzēt pacientu triāžā. Mēs teorētizējām, ka CDS modeli var veiksmīgi federēt, ņemot vērā tā datu ievades izmantošanu, kas ir salīdzinoši izplatīta klīniskajā praksē un kas lielā mērā nav atkarīga no operatora atkarīgajiem pacientu stāvokļa novērtējumiem (piemēram, klīniskajiem iespaidiem vai ziņotajiem simptomiem). Drīzāk tika izmantoti laboratorijas rezultāti, vitālas pazīmes, attēlveidošanas pētījums un parasti uztverta demogrāfiskā informācija (t.i., vecums). Tāpēc mēs pārtrenējām CDS modeli ar dažādiem datiem, izmantojot klienta-servera FL pieeju, lai izstrādātu jaunu globālu FL modeli, kas tika nosaukts Mūsu hipotēze bija tāda, ka EXAM darbosies labāk nekā vietējie modeļi un vispārinātos labāk visās veselības aprūpes sistēmās. Rezultāti Eksāmena arhitektūra EXAM modelis ir balstīts uz iepriekšminēto CDS modeli. Kopumā 20 iezīmes (19 no EMR un viena no CXR) tika izmantotas kā izejviela modelim. Rezultātu (t.i., “ziemeļu patiesība”) etiķetes tika piešķirtas, pamatojoties uz pacienta skābekļa terapiju pēc 24 un 72 stundu periodiem no sākotnējās uzņemšanas ārkārtas dienestā (ED). Detalizētu pieprasīto iezīmju un rezultātu sarakstu var redzēt tabulā . 27 1 Pacientu rezultātu marķējumi tika iestatīti uz 0, 0,25, 0,50 un 0,75 atkarībā no intensīvākās skābekļa terapijas, ko pacients saņēma prognozes logā. Skābekļa terapijas kategorijas attiecīgi bija telpu gaiss (RA), zema skābekļa plūsma (LFO), augsta skābekļa plūsma (HFO)/noninvazīva ventilācija (NIV) vai mehāniskā ventilācija (MV). Ja pacients nomira prognozes logā, rezultātu marķējums tika iestatīts uz 1. Attiecībā uz EMR funkcijām tika izmantotas tikai pirmās vērtības, kas uztvertas ED, un datu pirmapstrāde ietvēra deidentifikāciju, trūkstošo vērtību imputāciju un normalizāciju līdz nullei vidējai un vienības variācijai. Tādējādi modelis apvieno informāciju no EMR un CXR funkcijām, izmantojot 34 slāņu konvolucionāro neirālo tīklu (ResNet34), lai iegūtu funkcijas no CXR un Deep & Cross tīkla, lai savienotu funkcijas kopā ar EMR funkcijām (vairāk detalizētas informācijas skatīt Modelēšanas rezultāts ir riska rezultāts, ko sauc par EXAM rezultātu, kas ir nepārtraukta vērtība diapazonā no 0 līdz 1 katrai no 24 un 72 stundu prognozēm, kas atbilst iepriekš aprakstītajām etiķetēm. Metodes Federācijas modelis EXAM modelis tika apmācīts, izmantojot kohortu no 16,148 gadījumiem, padarot to ne tikai starp pirmajiem FL modeļiem COVID-19, bet arī ļoti lielu un daudzkontinentālu attīstības projektu klīniski nozīmīgu AI (Fig. Dati starp vietām pirms iegūšanas netika saskaņoti, un, ņemot vērā reālos klīniskos informatīvos apstākļus, datu ievades rūpīgu saskaņošanu autori neveica (Fig. Tātad ) 1a, b 1 C, D , Pasaules karte, kas parāda 20 dažādas klientu vietnes, kas veicina EXAM pētījumu. , Katras iestādes vai vietnes ieguldīto lietu skaits (klients 1 pārstāv vietni, kas sniedz vislielāko lietu skaitu). Krūšu rentgena intensitātes sadalījums katrā klienta vietnē. , Pacientu vecums katrā klientu vietnē, norādot minimālo un maksimālo vecumu (zvaigznītes), vidējo vecumu (trīsstūri) un standarta novirzi (horizontālās joslas). . a b c d 1 Mēs salīdzinājām vietēji apmācītos modeļus ar globālo FL modeli katra klienta testēšanas datiem. « 1 × 10–3, Wilcoxon parakstītais ranga tests) 16% (kā definēts ar vidējo AUC, kad modelis darbojas attiecīgajās vietējās testēšanas kopās: no 0,795 līdz 0,920, vai 12,5 procentu punkti) (Fig. Tas arī izraisīja 38% uzlabojumu vispārināšanai (kā definēts vidējā AUC, kad modelis darbojas visos testēšanas komplektos: no 0,667 līdz 0,920, vai 25,3 procentu punkti) labākajā globālajā modelī, lai prognozētu 24 stundu skābekļa apstrādi, salīdzinot ar modeļiem, kas apmācīti tikai uz vietas pašu datiem (Fig. Attiecībā uz 72 stundu skābekļa apstrādes prognozēšanas rezultātiem labākā globālā modeļa apmācība izraisīja vidējo veiktspējas uzlabošanos par 18% salīdzinājumā ar vietēji apmācītajiem modeļiem, savukārt globālā modeļa vispārināmība uzlabojās vidēji par 34% (paplašinātie dati. Mūsu rezultātu stabilitāte tika apstiprināta, atkārtojot trīs lokālo un FL apmācību kursu dažādos nejaušos datu sadalījumos. P 2a 2B 1 , Katra klienta testa veiktspēja tiek noteikta, prognozējot 24 stundu skābekļa apstrādi modeļiem, kas apmācīti tikai pēc vietējiem datiem (vietējais) salīdzinājumā ar labāko globālo modeli, kas pieejams serverī (sk. labāko). , Vispārīgums (vidējais veiktspējas rādītājs citu vietņu testēšanas datiem, kas atspoguļots vidējā AUC) kā klienta datu kopuma lieluma funkcija (nav gadījumu). Zaļā horizontālā līnija norāda vislabākā globālā modeļa vispārināmības veiktspēju. Parāda 18 no 20 klientiem, jo klientam 12 bija rezultāti tikai par 72-h skābekli (Paplašinātie dati). ) un klientam 14 bija gadījumi tikai ar RA ārstēšanu, tādā veidā novērtēšanas rādītājs (AUC) nav piemērojams nevienā no šiem gadījumiem ( Dati par klientu 14 tika izslēgti arī no vidējās vispārināmības aprēķina vietējos modeļos. a b 1 Metodes Vietējie modeļi, kas tika apmācīti, izmantojot nelīdzsvarotas kohortas (piemēram, galvenokārt vieglus COVID-19 gadījumus), ievērojami gūst labumu no FL pieejas, ievērojami uzlabojot paredzamo vidējo AUC veiktspēju kategorijām ar tikai dažiem gadījumiem. tas bija acīmredzams klientu vietnē 16 (nelīdzsvarots datu kopums), ar lielāko daļu pacientu, kuriem ir viegla slimības smaguma pakāpe un tikai ar dažiem smagiem gadījumiem. Paplašinātā datu figūra. Vēl svarīgāk, FL modeļa vispārināmība ievērojami palielinājās salīdzinājumā ar vietēji apmācīto modeli. 3a 2 , ROC klientu vietnē 16, ar nelīdzsvarotiem datiem un galvenokārt vieglajiem gadījumiem. , ROC vietējā modeļa klientu vietnē 12 (maza datu kopa), vidējais ROC modeļiem, kas apmācīti lielākos datu kopos, kas atbilst piecām klientu vietām Bostonas apgabalā (1, 4, 5, 6, 8) un ROC labākajam globālajam modelim, prognozējot 72-h skābekļa apstrādi dažādos EXAM rezultātu sliekšņos (pa kreisi, vidēji, pa labi). Vidējais ROC tiek aprēķināts, pamatojoties uz pieciem vietēji apmācītiem modeļiem, bet pelēkais apgabals norāda ROC standarta novirzi. Pos un neg norāda pozitīvo un negatīvo gadījumu skaitu, attiecīgi, kā definēts šajā EXAM rezultātu diapazonā. a b t Attiecībā uz klientu vietnēm ar salīdzinoši maziem datu kopumiem labākais FL modelis ievērojami pārsniedza ne tikai vietējo modeli, bet arī tos, kas apmācīti lielākos datu kopos no piecām klientu vietnēm Bostonas apgabalā ASV (Fig. Tātad ) 3B Globālais modelis veiksmīgi prognozēja skābekļa nepieciešamību 24/72 stundu laikā gan COVID pozitīviem, gan negatīviem pacientiem (paplašinātie dati). Tātad ) 3 Validācija neatkarīgās vietnēs Pēc sākotnējās apmācības EXAM pēc tam tika pārbaudīts trijās neatkarīgās validācijas vietās: Cooley Dickinson Hospital (CDH), Martha’s Vineyard Hospital (MVH) un Nantucket Cottage Hospital (NCH), kas atrodas Masačūsetsā, ASV. , un ROC līknes un neskaidrības matricas lielākajam datu kopumam (no CDH) ir parādītas attēlā. Darbības punkts tika iestatīts, lai atšķirtu starp ne-mehānisko ventilāciju un mehānisko ventilāciju (MV) ārstēšanu (vai nāvi). FL globālais apmācīts modelis, EXAM, sasniedza vidējo AUC 0,944 un 0,924 attiecīgi 24 un 72 stundu prognozēšanas uzdevumiem (tabula). Lai prognozētu MV ārstēšanu (vai nāvi) 24 stundu laikā, EXAM sasniedza jutīgumu 0,950 un specifiku 0,882 CDH, un jutīgumu 1000 specifiku 0,934 MVH. NCH 24 stundu laikā nebija nevienu MV / nāves gadījumu. Attiecībā uz 72-h MV prognozi, EXAM sasniedza jutīgumu 0,929 un specifiku 0,880 CDH, jutīgumu 1000 un specifiku 0,976 MVH un jutīgumu 1000 un specifiku 0,929 NCH. 2 4 2 , , Performance (ROC) (top) un confusion matrices (bottom) no EXAM FL modeļa uz CDH datu kopu, lai prognozētu skābekļa pieprasījumu 24 h ( Pēc 72 stundām ( ROC ir trīs atšķirīgas griešanas vērtības ( Eksāmena riska rādītājs ir norādīts. a b a b t Attiecībā uz MV pie CDH 72 h, EXAM bija zems viltus negatīvs rādītājs 7,1%. , parādot divus nepatiesi negatīvos gadījumus no CDH, kur vienam gadījumam bija daudz trūkstošo EMR datu funkciju un otram bija CXR ar kustības artefaktu un dažām trūkstošām EMR funkcijām. 4 Diferenciālas privātuma izmantošana Galvenā motivācija veselības aprūpes iestādēm izmantot FL ir saglabāt savu datu drošību un privātumu, kā arī ievērot datu atbilstības pasākumus. vai pat apmācību attēlu rekonstrukcija no pašiem modeļa gradientiem Lai apkarotu šos riskus, tika izmantoti drošības uzlabošanas pasākumi, lai mazinātu risku, ja datu “apķīlāšana” notiktu vietnes-servera komunikācijas laikā. Mēs eksperimentējām ar metodēm, lai izvairītos no FL datu uztveršanas, un pievienojām drošības funkciju, kas, mūsuprāt, varētu mudināt vairāk iestāžu izmantot FL. Izpētot daļējas svaru sadales shēmu , , , mēs parādījām, ka modeļi var sasniegt salīdzināmu veiktspēju pat tad, ja tiek koplietoti tikai 25% svara atjauninājumu (Paplašinātie dati. Tātad ) 47 48 49 50 50 51 52 5 Diskusija Šis pētījums ietver lielu, reālo veselības aprūpes FL pētījumu attiecībā uz vietņu skaitu un izmantoto datu punktu skaitu. Mēs uzskatām, ka tas nodrošina spēcīgu pierādījumu par FL izmantošanas iespējamību nepieciešamo AI modeļu ātrai un sadarbīgai izstrādei veselības aprūpes jomā. Mūsu pētījums ietvēra vairākas vietnes četros kontinentos un dažādu regulatīvo struktūru uzraudzībā, un tādējādi tur solījumu tikt nodrošinātam dažādiem regulētajiem tirgiem paātrinātā veidā. Globālais FL modelis, EXAM, izrādījās stabilāks un sasniedza labākus rezultātus atsevišķās vietās nekā jebkurš modelis, kas apmācīts tikai uz vietējiem datiem. Mēs uzskatām, ka konsekventu uzlabošanos panāca lielāks Attiecībā uz klientu vietni ar salīdzinoši mazu datu kopu, var izmantot divas tipiskas pieejas, lai pielāgotu lietderīgu modeli: viens ir apmācīt vietēji ar saviem datiem, otrs ir piemērot modeli, kas apmācīts uz lielāku datu kopu. Vietnēm ar mazām datu kopām, tas būtu bijis praktiski neiespējami veidot efektīvu dziļās mācīšanās modeli, izmantojot tikai savus vietējos datus. Noskaidrojums, ka šīs divas pieejas bija pārspējamas visos trīs prognozēšanas uzdevumos ar globālo FL modeli, liecina, ka klientu vietņu priekšrocība ar mazām datu kopām, kas izriet no dalības FL sadarbībā, ir ievērojama. Tas, visticamāk, atspoguļo FL spēju uztvert lielāku daudzveidību nekā vietējā . 46 Validācijas rezultāti apstiprināja, ka globālais modelis ir stingrs, atbalstot mūsu hipotēzi, ka FL apmācīti modeļi ir vispārināmi visās veselības aprūpes sistēmās. Tie nodrošina pārliecinošu piemēru prognozējošo algoritmu izmantošanai COVID-19 pacientu aprūpē un FL izmantošanai modeļu radīšanā un testēšanā. Piedaloties šajā pētījumā, klientu vietnes saņēma piekļuvi EXAM, lai tos vēl vairāk validētu pirms jebkāda regulatīvā apstiprinājuma vai turpmākas ieviešanas klīniskajā aprūpē. Plāni tiek izstrādāti, lai potenciāli validētu EXAM “ražošanas” iestatījumos MGB, izmantojot COVID-19 mērķa resursus. , kā arī dažādās vietās, kas nebija daļa no EXAM apmācības. 53 Ir publicēti vairāk nekā 200 prognozēšanas modeļi, kas atbalsta lēmumu pieņemšanu pacientiem ar COVID-19 Atšķirībā no lielākās daļas publikāciju, kas koncentrējās uz COVID-19 diagnozi vai mirstības prognozēšanu, mēs prognozējām skābekļa prasības, kam ir ietekme uz pacientu pārvaldību. Mēs arī izmantojām gadījumus ar nezināmu SARS-COV-2 statusu, un tāpēc modelis varēja sniegt informāciju ārstam pirms PCR rezultāta saņemšanas ar atgriezenisko transkripciju (RT-PCR), padarot to noderīgu reālai klīniskajai situācijai. Modela attēlveidošanas ievads tiek izmantots kopējā praksē, atšķirībā no modeļiem, kas izmanto krūšu datortomogrāfiju, kas ir nesaskaņas diagnostikas modalitāte. Modela dizains bija ierobežots ar objektīviem prognozētājiem, atšķirībā no daudziem publicētajiem pētīj 19 Pacientu kohortas identifikācija un datu saskaņošana nav jauni pētniecības un datu zinātnes jautājumi Lai racionalizētu datu sagatavošanu, ir nepieciešami uzlabojumi klīniskajās informācijas sistēmās, kas ļauj labāk izmantot FL iesaistīto vietņu tīklu.Tas, apvienojumā ar hiperparametru inženieriju, var ļaut algoritmiem efektīvāk “mācīties” no lielākām datu partijām un pielāgot modeļa parametrus konkrētai vietnei tālākai personalizācijai, piemēram, tālāk pielāgojot šo vietni. Sistēma, kas ļautu netraucētu, tuvu reāllaika modeļu secinājumu un rezultātu apstrādi, arī būtu noderīga un “slēgtu līkni” no apmācības līdz modeļu izvietošanai. 54 39 Tā kā dati nebija centralizēti, tie nav viegli pieejami. Ņemot vērā to, jebkura turpmākā rezultātu analīze, kas pārsniedz to, kas tika iegūts un savākts, ir ierobežota. Līdzīgi kā citi mašīntulkošanas modeļi, EXAM ir ierobežots ar apmācību datu kvalitāti. Iestādēm, kas vēlas ieviest šo algoritmu klīniskajai aprūpei, ir jāsaprot iespējamie aizspriedumi apmācībā. Piemēram, marķējumi, kas izmantoti kā pamata patiesība EXAM modeļa apmācībā, tika iegūti no pacienta 24- un 72-h skābekļa patēriņa; tiek pieņemts, ka pacientiem piegādātais skābeklis atbilst skābekļa vajadzībām. Tomēr COVID-19 pandēmijas agrīnā stadijā daudziem pacientiem profilaktiski tika nodrošināta augsta skābekļa plūsma neatkarīgi no viņu skābekļa vajadzībām. Tā kā mūsu piekļuve datiem bija ierobežota, mums nebija pietiekami daudz informācijas, lai izveidotu detalizētu statistiku par neveiksmju cēloņiem, post hoc, lielākajā daļā vietņu.Tomēr mēs pētījām neveiksmju gadījumus no lielākās neatkarīgās testēšanas vietnes, CDH, un varējām ģenerēt hipotēzes, kuras mēs varētu pārbaudīt nākotnē. Nākotnē mēs arī plānojam izpētīt iespējamo “populācijas izliekumu” dažādās slimības progresēšanas fāzēs. Viena no funkcijām, kas uzlabotu šāda veida liela mēroga sadarbību, ir spēja prognozēt katras klientu vietnes ieguldījumu globālā FL modeļa uzlabošanā.Tas palīdzēs klientu vietņu atlasē un datu iegūšanas un anotācijas centienu prioritizēšanā.Pēdējais ir īpaši svarīgs, ņemot vērā šo lielo konsorciju centienu augstās izmaksas un sarežģīto loģistiku, un tas ļaus šiem centieniem uztvert daudzveidību, nevis tikai datu paraugu daudzumu. Nākotnes pieejas var ietvert automatizētu hiperparametru meklēšanu Neironu arhitektūras meklēšana un citas automatizētas mašīntulkošanas metodes pieejas, lai efektīvāk atrastu optimālos apmācības parametrus katrai klienta vietnei. 55 56 57 Zināmi jautājumi par partiju normalizāciju (BN) FL motivēja mūs labot mūsu bāzes modeli attēla iezīmju ekstrakcijai Nākotnē darbs varētu izpētīt dažāda veida normalizācijas paņēmienus, lai ļautu efektīvāk apmācīt AI modeļus FL, kad klienta dati ir neatkarīgi un identiski sadalīti. 58 49 Nesenie darbi par privātuma uzbrukumiem FL iestatījumos ir izraisījuši bažas par datu noplūdi modeļu apmācības laikā Tajā pašā laikā aizsardzības algoritmi joprojām nav izpētīti un tos ierobežo vairāki faktori. , , parādīt labu aizsardzību, tie var vājināt modeļa veiktspēju. šifrēšanas algoritmi, piemēram, homomorfā šifrēšana Kvantitatīvs veids, kā izmērīt privātumu, ļautu labāk izvēlēties nepieciešamos minimālos privātuma parametrus, vienlaikus saglabājot klīniski pieņemamu sniegumu , , . 59 36 48 49 60 36 48 49 Pēc turpmākas validācijas mēs paredzam EXAM modeļa ieviešanu ED iestatījumos kā veidu, kā novērtēt risku gan pacienta, gan iedzīvotāju līmenī, un sniegt klīnikām papildu atsauces punktu, veicot bieži sarežģīto pacientu skrīninga uzdevumu. Mēs arī paredzam izmantot modeli kā jutīgāku iedzīvotāju līmeni, lai palīdzētu līdzsvarot resursus starp reģioniem, slimnīcām un departamentiem. Metodes Ētikas apstiprinājums Visas inficētās veselības institūcijas, kas saņēmušas informāciju no Toronto Universitātes veselības centra, tika veiktas saskaņā ar Helsinku deklarācijā un Starptautiskajā konferencē par labas klīniskās prakses saskaņošanu noteiktajiem cilvēka eksperimentēšanas principiem un tika apstiprinātas ar attiecīgajām institūciju pārskata padomēm šādās validēšanas vietās: CDH, MVH, NCH un šādās apmācības vietās: MGB, Mass General Hospital (MGH), Brigham and Women’s Hospital, Newton-Wellesley Hospital, North Shore Public Medical Center un New Faulkner Hospital (visi astoņi no šiem slimnīcām tika iekļauti saskaņā ar MGB ētikas padomes atsauci, Nr. 2020P002673, un informētā piekrišana tika atteikta no institucionālās pārskata Tika ievērotas MI-CLAIM pamatnostādnes par klīnisko AI modeļu ziņošanu (Papildu piezīme) ) 2 Pētījums Setting Pētījums ietvēra datus no 20 institūcijām (fig. ): MGB, MGH, Brigham un sieviešu slimnīca, Newton-Wellesley slimnīca, North Shore Medicīnas centrs un Faulkner slimnīca; Bērnu Nacionālā slimnīca Vašingtonā, DC; NIHR Cambridge Biomedicīnas pētniecības centrs; Pašaizsardzības spēku Centrālā slimnīca Tokijā; Nacionālā Taivānas Universitāte MeDA Lab un MAHC un Taivānas Nacionālā veselības apdrošināšanas administrācija; Tri-Service Vispārējā slimnīca Taivānā; Kyungpook Nacionālā universitātes slimnīca Dienvidkorejā; Medicīnas fakultāte, Chulalongkorn Universitāte Taizemē; Diagnosticos da America SA Brazīlijā; Kalifornijas Universitāte, Sanfrancisko; VA San Diego; Toronto Universitāte; Nacion , , Dati no trim neatkarīgām vietām tika izmantoti neatkarīgai validācijai: CDH, MVH un NCH, visi Masačūsetsā, ASV. Šīm trim slimnīcām bija pacientu populācijas raksturlielumi, kas atšķīrās no apmācības vietām.Dati, kas izmantoti algoritma validācijai, sastāv no pacientiem, kas tika uzņemti uz ED šajās vietās no 2020. gada marta līdz 2021. gada februārim, un tie atbilda tiem pašiem iekļaušanas kritērijiem, kas izmantoti, lai apmācītu FL modeli. 1a 61 62 63 Datu vākšana 20 klientu vietās kopumā tika sagatavoti 16 148 gadījumi (gan pozitīvi, gan negatīvi) modeļa apmācības, validācijas un testēšanas nolūkos (Fig. Medicīniskie dati tika iegūti attiecībā uz pacientiem, kas atbilda pētījuma iekļaušanas kritērijiem. Klientu vietnes centās iekļaut visus COVID pozitīvos gadījumus no pandēmijas sākuma 2019. gada decembrī un līdz brīdim, kad viņi sāka vietējo apmācību EXAM pētījumam. Visas vietējās apmācības sākās 2020. gada 30. septembrī. Vietnes iekļāva arī citus pacientus tajā pašā periodā ar negatīviem RT–PCR testa rezultātiem. Tā kā lielākajā daļā vietņu bija vairāk SARS-COV-2 negatīvo pacientu nekā pozitīvo, mēs ierobežojām iekļauto negatīvo pacientu skaitu līdz ne vairāk kā 95% no kopējiem gadījumiem katrā klientu vietnē. 1B “Lieta” ietvēra CXR un nepieciešamos datu ievadus, kas iegūti no pacienta medicīniskā ieraksta. CXR attēla intensitātes (pixel vērtību) izplatība un modeļi vietnēs ievērojami atšķīrās daudzu pacientu un vietņu specifisko faktoru dēļ, piemēram, dažādu ierīču ražotāju un attēlveidošanas protokolu dēļ, kā parādīts attēlā. Pacientu vecums un EMR iezīmes sadalījums vietās ievērojami atšķīrās, kā paredzams, pateicoties atšķirīgajai demogrāfijai starp globāli izplatītajām slimnīcām (Paplašinātie dati. Tātad ) 1B 1 C, D 6 Pacientu iekļaušanas kritēriji Pacienta iekļaušanas kritēriji bija: (1) pacients tika iesniegts slimnīcas ED vai līdzvērtīgs; (2) pacients bija RT-PCR tests veikts jebkurā laikā starp prezentāciju ED un izvadīšanu no slimnīcas; (3) pacientam bija CXR ED; un (4) pacienta ieraksts bija vismaz piecas no EMR vērtībām, kas aprakstītas tabulā. , visi iegūti ED un attiecīgie rezultāti, kas iegūti hospitalizācijas laikā. piezīme, CXR, laboratorijas rezultāti un izmantotie vitāli bija pirmie pieejami uztveršanai ED apmeklējuma laikā. modelis neiekļāva nekādus CXR, laboratorijas rezultātus vai vitālus, kas iegūti pēc ED atstādināšanas. 1 Ienākumu modelis Kopumā 21 EMR iezīme tika izmantota kā izeja uz modeli. rezultātu (t.i., pamata patiesības) etiķetes tika piešķirtas, pamatojoties uz pacienta prasībām pēc 24 un 72 stundu periodiem no sākotnējās uzņemšanas uz ED. Detalizētu sarakstu ar pieprasītajām EMR iezīmēm un rezultātiem var apskatīt tabulā . 1 Skābekļa apstrādes sadalījums, izmantojot dažādas ierīces dažādās klientu vietās, ir parādīts paplašinātā datu figūrā. , kas detalizēti apraksta ierīces lietošanu ED uzņemšanas laikā un pēc 24 un 72 stundu periodiem.Datu kopu sadalījuma atšķirības starp lielākajām un mazākajām klientu vietnēm var redzēt paplašinātā datu figūrā. . 7 8 Pozitīvo COVID-19 gadījumu skaits, kas apstiprināts ar vienu RT-PCR testu, kas iegūts jebkurā laikā starp prezentāciju ED un izvadīšanu no slimnīcas, ir uzskaitīts Papildu tabulā. Katrai klientu vietnei tika lūgts izlases kārtā sadalīt savu datu kopumu trijās daļās: 70% apmācībai, 10% validācijai un 20% testēšanai. 1 Izmēģiniet attīstības modeli Pastāv plašas atšķirības pacientu klīniskajā gaitā, kuri tiek hospitalizēti ar COVID-19 simptomiem, un dažiem pacientiem ir strauja elpošanas funkcijas pasliktināšanās, kas prasa dažādas iejaukšanās, lai novērstu vai mazinātu hipoksēmiju. , Svarīgs lēmums, kas pieņemts, novērtējot pacientu sākotnējā aprūpes punktā vai ED, ir tas, vai pacientam, iespējams, būs nepieciešami invazīvāki vai resursu ierobežoti pretpasākumi vai iejaukšanās (piemēram, MV vai monoklonālie antivielas), un tādēļ viņam būtu jāsaņem reti, bet efektīva terapija, terapija ar šauru riska un ieguvuma attiecību blakusparādību dēļ vai augstāks aprūpes līmenis, piemēram, uzņemšana intensīvās aprūpes nodaļā. Savukārt pacients, kuram ir mazāks risks, ka nepieciešama invazīva skābekļa terapija, var tikt ievietots mazāk intensīvā aprūpē, piemēram, regulārā nodaļā, vai pat atbrīvots no ED, lai turpinātu pašpārbaudi mājās. EXAM tika izstrādāts, lai palīdzētu šādiem pacientiem. 62 63 64 65 Jāatzīmē, ka modelis šobrīd nav apstiprināts nevienā regulatīvajā aģentūrā, un to vajadzētu izmantot tikai pētniecības nolūkos. Eksāmena rezultāti EXAM tika apmācīts, izmantojot FL; tas rada riska punktu (tā saukto EXAM punktu), kas ir līdzīgs CORISK (Papildināts ar paplašināto datu lapu. Tas atbilst pacienta skābekļa atbalsta prasībām divos logos — 24 un 72 stundas — pēc sākotnējās prezentācijas ED. ilustrē, kā CORISK un EXAM rezultātu var izmantot pacientu šķirošanai. 27 9a 9b Krūšu rentgena attēli tika iepriekš apstrādāti, lai izvēlētos priekšējo pozīciju attēlu un izslēgtu sānu skatu attēlus, un pēc tam izmērīti līdz 224 × 224 izšķirtspējai. , modelis apvieno informāciju no gan EMR, gan CXR funkcijām (pamatojoties uz modificētu ResNet34 ar telpisko uzmanību iepriekš apmācīts CheXpert datu kopumā) Deep & Cross tīkls Lai konverģētu šos dažādos datu veidus, no katra CXR attēla tika iegūts 512-dimensiju funkciju vektors, izmantojot iepriekš apmācītu ResNet34, ar telpisko uzmanību, pēc tam savienots ar EMR funkcijām kā Deep & Cross tīkla ievadi. Mēs izmantojām cross-entropiju kā zaudējumu funkciju un “Adam” kā optimizatoru. Izmantojot NVIDIA Clara Train SDK Vidējais AUC klasifikācijas uzdevumiem (≥LFO, ≥HFO/NIV vai ≥MV) tika aprēķināts un izmantots kā galīgais novērtējuma rādītājs, ar normalizāciju līdz nullei vidēji un vienības svārstībām. Tātad ) 9a 66 67 68 9b 69 70 27 Funkcijas imputācija un normalizācija Nepareizs algoritms tika izmantots, lai aprēķinātu EMR funkcijas, pamatojoties uz vietējo apmācību datu kopu. Ja EMR funkcija bija pilnīgi trūkst no klienta vietnes datu kopas, tika izmantota vidējā vērtība, kas aprēķināta tikai uz datiem no MGB klientu vietnēm. 71 EMR-CXR datu apvienošanas detaļas, izmantojot Deep & Cross tīklu Lai modelētu funkciju mijiedarbību no EMR un CXR datiem gadījuma līmenī, tika izmantota dziļo funkciju shēma, pamatojoties uz Deep & Cross tīkla arhitektūru. Binārās un kategoriskās iezīmes EMR ieejām, kā arī 512-dimensiju attēlu iezīmes CXR, tika pārveidotas par reālo vērtību apvienotajiem blīvajiem vektoriem, ievietojot un ievietojot slāņus. Transformētie blīvie vektori kalpoja kā izeja saplūšanas sistēmai, kas īpaši izmantoja šķērsgriezuma tīklu, lai īstenotu saplūšanu starp ieejām no dažādiem avotiem. šķērsgriezuma tīkls veica skaidru funkciju šķērsgriezumu savos slāņos, vadot iekšējos produktus starp sākotnējo ieejas funkciju un iznākumu no iepriekšējā slāņa, tādējādi palielinot mijiedarbības pakāpi starp funkcijām. 68 FL detaļas Iespējams, ka visizplatītākā FL forma ir federētā vidējā algoritma īstenošana, kā to ierosināja McMahan et al. , vai to variācijas. Šis algoritms var tikt realizēts, izmantojot klienta-servera iestatījumu, kurā katra iesaistītā vietne darbojas kā klients. Var domāt par FL kā metodi, kuras mērķis ir samazināt globālo zaudējumu funkciju, samazinot lokālo zaudējumu funkciju kopumu, kas tiek lēsts katrā vietnē. Ar katra klienta vietnes lokālo zaudējumu samazināšanu, vienlaikus sinhronizējot apgūto klientu vietnes svaru uz centralizēta agregācijas servera, var samazināt globālo zaudējumu bez nepieciešamības piekļūt visam datu kopumam centralizētā vietā. Katra klientu vietne mācās lokāli un koplieto modeļa svaru atjauninājumus ar centrālo serveri, kas agregē ieguldījumus, izmantojot drošu spraudņu slāņa šifrēšanu un komunikācijas protokolus. Tātad ) 72 9c FL pseidoalgoritms ir parādīts Papildu piezīmē Mūsu eksperimentos mēs nosakām federēto kārtu skaitu = 200, ar vienu vietējo apmācību periodu katrā kārtā par katru klientu. klientu skaits, , bija līdz 20 atkarībā no klientu tīkla savienojamības vai pieejamajiem datiem par konkrētu mērķtiecīgu rezultātu periodu (24 vai 72 h). , atkarīgs no katra klienta datu kopas lieluma un tiek izmantota, lai svērtu katra klienta ieguldījumus, apkopojot modeļa svaru federētā vidējā vērtībā. FL apmācības uzdevuma laikā katra klienta vietne izvēlas savu labāko vietējo modeli, izsekojot modeļa veiktspējai savā vietējā validācijas komplektā.Tajā pašā laikā serveris nosaka labāko globālo modeli, pamatojoties uz vidējiem validācijas rezultātiem, kas nosūtīti no katras klienta vietnes uz serveri pēc katras FL kārtas. 1 T t K NK k Adam optimizētājs tika izmantots gan vietējai apmācībai, gan FL ar sākotnējo mācīšanās ātrumu 5 × 10–5 un pakāpenisku mācīšanās ātruma degradāciju ar faktoru 0,5 pēc katras 40 epoķes, kas ir svarīgi federēto vidējo rādītāju konverģencei. Nejaušas afinitātes transformācijas, ieskaitot rotāciju, tulkošanu, griešanu, skalēšanu un nejaušas intensitātes troksni un svārstības, tika piemērotas attēliem datu palielināšanai apmācības laikā. 73 Sakarā ar BN slāņu jutīgumu strādājot ar dažādiem klientiem neatkarīgā un identiski izplatītā vidē, mēs konstatējām, ka vislabākā modeļa veiktspēja notiek, saglabājot iepriekš apmācīto ResNet34 ar telpisku uzmanību. FL apmācības laikā fiksētie parametri (t.i., izmantojot nulles mācīšanās ātrumu šiem slāņiem). Deep & Cross tīkls, kas apvieno attēla funkcijas ar EMR funkcijām, nesatur BN slāņus un līdz ar to netika ietekmētas BN nestabilitātes problēmas. 58 47 Šajā pētījumā mēs izpētījām privātuma saglabāšanas shēmu, kas dalās tikai daļējos modeļa atjauninājumos starp serveri un klientu vietnēm. Svara atjauninājumi katras iterācijas laikā tika klasificēti pēc ieguldījuma lieluma, un tikai noteikts procents no lielākajiem svaru atjauninājumiem tika koplietoti ar serveri. a) paplašinātas datu bāzes. ), kas aprēķināts no visiem nullei nepiemērotiem gradientiem, Δ Tas var būt atšķirīgs katram klientam. Katrā FL kārtā Šīs shēmas variācijas varētu ietvert papildu lielu gradientu vai diferencētu privātuma shēmu griešanu. kas pievieno nejaušu troksni gradientiem vai pat neapstrādātiem datiem pirms barošanas tīklā . k 5 Dzīvoklis(t) k t 49 51 Statistiskā analīze Mēs veicām Wilcoxon parakstīto rangu testu, lai apstiprinātu novērotās veiktspējas uzlabošanās nozīmīgumu starp vietēji apmācīto modeli un FL modeli 24 un 72 stundu laikā (Fig. Paplašinātā datu figūra. Nulles hipotēze tika noraidīta ar vienpusēju « 1 × 10–3 abos gadījumos. 2 1 P Tika izmantota Pearsona korelācija, lai novērtētu vietējā apmācītā modeļa vispārināmību (vidējās AUC vērtības stabilitāti citu klientu vietņu testa datiem) attiecībā uz attiecīgo vietējo datu kopu lielumu. Tas ir 0,43, = 0,035, brīvības pakāpes (df) = 17 24-stundu modelim un 0 0 62 , = 0,003, df = 16 72-h modelim).Tas norāda, ka vienīgi datu kopu lielums nav vienīgais faktors, kas nosaka modeļa izturību pret neredzamiem datiem. r P r P Lai salīdzinātu ROC līknes no globālā FL modeļa un vietējiem modeļiem, kas apmācīti dažādās vietās (Paplašinātie dati. ), mēs bootstrapped 1000 paraugus no datiem un aprēķināja iegūto AUCs. mēs pēc tam aprēķināja starpību starp divām sērijām un standartizēts, izmantojot formulu = (AUC1 – AUC2) vai Kur kur ir standartizēta atšķirība, ir bootstrap atšķirību standarta novirze, un AUC1 un AUC2 ir attiecīgās bootstrapped AUC sērijas. Ar normālu sadalījumu mēs iegūstam vērtības, kas attēlotas papildu tabulā Rezultāti liecina, ka nulles hipotēze tika noraidīta ar ļoti zemu vērtības, kas norāda statistisko nozīmīgumu pārākumu FL rezultātus. vērtības tika veiktas R ar pROC bibliotēku . 3 D s D s D P 2 P P 74 Tā kā modelis paredz diskrētu rezultātu, nepārtrauktu rezultātu no 0 līdz 1, nav iespējams veikt tiešu kalibrēšanas novērtējumu, piemēram, qqplot. Mēs veicām vienvirziena variācijas analīzi (ANOVA) testus, lai salīdzinātu vietējos un FL modeļa rezultātus starp četrām pamata patiesības kategorijām (RA, LFO, HFO, MV). -statistika, kas aprēķināta kā izmaiņas starp paraugu nozīmē sadalīts ar izmaiņām paraugu un kas atspoguļo izkliedēšanas pakāpi starp dažādām grupām, tika izmantota, lai kvantitatīvi modeļi. -piecu dažādu vietņu vērtības ir 245.7, 253.4, 342.3, 389.8 un 634.8, bet FL modeļa vērtība ir 843.5. -vērtības nozīmē, ka grupas ir vairāk atdalāmas, rezultāti no mūsu FL modeļa skaidri parāda lielāku izkliedēšanos starp četrām pamata patiesības kategorijām. ANOVA testa vērtība FL modelī ir <2 × 10–16, kas norāda, ka FL prognozēšanas rezultāti dažādās prognozēšanas klasēs ir statistiski nozīmīgi atšķirīgi. 10 F F F P Ziņošanas kopsavilkums Sīkāka informācija par pētniecības projektu pieejama Saistīts ar šo rakstu. Dabas pētījumu kopsavilkums Datu pieejamība Datu kopums no 20 institūcijām, kas piedalījās šajā pētījumā, paliek to glabāšanā. Šie dati tika izmantoti apmācībai katrā no vietējām vietnēm un netika kopīgoti ar nevienu no citām iesaistītajām institūcijām vai ar federēto serveri, un tie nav publiski pieejami. Dati no neatkarīgām validācijas vietnēm tiek uzturēti CAMCA, un piekļuvi var pieprasīt, sazinoties ar Q.L. Pamatojoties uz CAMCA noteikumu, datu koplietošanas pārskatīšanu un izmaiņas IRB pētniecības nolūkos var veikt MGB pētniecības administrācija un saskaņā ar MGB IRB un politiku. Koda pieejamība Visi šajā pētījumā izmantotie kodi un programmatūra ir publiski pieejami NGC. Lai piekļūtu, pierakstītos kā viesis vai izveidotu profilu, ievadiet vienu no tālāk norādītajiem URL. Apmācīti modeļi, datu sagatavošanas vadlīnijas, apmācības kods, modeļa pārbaudes validēšana, readme fails, instalācijas vadlīnijas un licences faili ir publiski pieejami NVIDIA NGC : no Federētā mācību programmatūra ir pieejama kā daļa no Clara Train SDK: Alternatīvi, izmantojiet šo komandu, lai lejupielādētu modeli "wget --content-disposition -O clara_train_covid19_exam_ehr_xray_1.zip”. 61 https://ngc.nvidia.com/catalog/models/nvidia:med:clara_train_covid19_exam_ehr_xray https://ngc.nvidia.com/catalog/containers/nvidia:clara-train-sdk https://api.ngc.nvidia.com/v2/models/nvidia/med/clara_train_covid19_exam_ehr_xray/versions/1/zip References Budd, J. et al. Digital technologies in the public-health response to COVID-19. , 1183–1192 (2020). Nat. Med. 26 Moorthy, V., Henao Restrepo, A. M., Preziosi, M.-P. & Swaminathan, S. Data sharing for novel coronavirus (COVID-19). , 150 (2020). Bull. World Health Organ. 98 Chen, Q., Allot, A. & Lu, Z. Keep up with the latest coronavirus research. , 193 (2020). Nature 579 Fabbri, F., Bhatia, A., Mayer, A., Schlotter, B. & Kaiser, J. BCG IT spend pulse: how COVID-19 is shifting tech priorities. (2020). https://www.bcg.com/publications/2020/how-covid-19-is-shifting-big-it-spend Candelon, F., Reichert, T., Duranton, S., di Carlo, R. C. & De Bondt, M. The rise of the AI-powered company in the postcrisis world. (2020). https://www.bcg.com/en-gb/publications/2020/business-applications-artificial-intelligence-post-covid Chao, H. et al. Integrative analysis for COVID-19 patient outcome prediction. , 101844 (2021). Med. Image Anal. 67 Zhu, X. et al. Joint prediction and time estimation of COVID-19 developing severe symptoms using chest CT scan. , 101824 (2021). Med. Image Anal. 67 Yang, D. et al. Federated semi-supervised learning for Covid region segmentation in chest ct using multi-national data from China, Italy, Japan. , 101992 (2021). Med. Image Anal. 70 Minaee, S., Kafieh, R., Sonka, M., Yazdani, S. & Jamalipour Soufi, G. Deep-COVID: predicting COVID-19 from chest X-ray images using deep transfer learning. , 101794 (2020). Med. Image Anal. 65 COVID-19 Studies from the World Health Organization Database. (2020). https://clinicaltrials.gov/ct2/who_table ACTIV. (2020). https://www.nih.gov/research-training/medical-research-initiatives/activ Coronavirus Treatment Acceleration Program (CTAP). US Food and Drug Administration (2020). https://www.fda.gov/drugs/coronavirus-covid-19-drugs/coronavirus-treatment-acceleration-program-ctap Gleeson, P., Davison, A. P., Silver, R. A. & Ascoli, G. A. A commitment to open source in neuroscience. , 964–965 (2017). Neuron 96 Piwowar, H. et al. The state of OA: a large-scale analysis of the prevalence and impact of open access articles. , e4375 (2018). PeerJ. 6 European Society of Radiology (ESR). What the radiologist should know about artificial intelligence – an ESR white paper. , 44 (2019). Insights Imaging 10 Pesapane, F., Codari, M. & Sardanelli, F. Artificial intelligence in medical imaging: threat or opportunity? Radiologists again at the forefront of innovation in medicine. , 35 (2018). Eur. Radiol. Exp. 2 Price, W. N. 2nd & Cohen, I. G. Privacy in the age of medical big data. , 37–43 (2019). Nat. Med. 25 Liang, W. et al. Development and validation of a clinical risk score to predict the occurrence of critical illness in hospitalized patients with COVID-19. , 1081–1089 (2020). JAMA Intern. Med. 180 Wynants, L. et al. Prediction models for diagnosis and prognosis of covid-19 infection: systematic review and critical appraisal. , m1328 (2020). Brit. Med. J. 369 Zhang, L. et al. D-dimer levels on admission to predict in-hospital mortality in patients with Covid-19. , 1324–1329 (2020). J. Thromb. Haemost. 18 Sands, K. E. et al. Patient characteristics and admitting vital signs associated with coronavirus disease 2019 (COVID-19)-related mortality among patients admitted with noncritical illness. (2020). https://doi.org/10.1017/ice.2020.461 American College of Radiology. CR recommendations for the use of chest radiography and computed tomography (CT) for suspected COVID-19 infection. (2020). https://www.acr.org/Advocacy-and-Economics/ACR-Position-Statements/Recommendations-for-Chest-Radiography-and-CT-for-Suspected-COVID19-Infection Rubin, G. D. et al. The role of chest imaging in patient management during the COVID-19 pandemic: a multinational consensus statement from the Fleischner Society. , 172–180 (2020). Radiology 296 World Health Organization. Use of chest imaging in COVID-19. (2020). https://www.who.int/publications/i/item/use-of-chest-imaging-in-covid-19 Jamil, S. et al. Diagnosis and management of COVID-19 disease. , 10 (2020). Am. J. Respir. Crit. Care Med. 201 Redmond, C. E., Nicolaou, S., Berger, F. H., Sheikh, A. M. & Patlas, M. N. Emergency radiology during the COVID-19 pandemic: The Canadian Association of Radiologists Recommendations for Practice. , 425–430 (2020). Can. Assoc. Radiologists J. 71 Buch, V. et al. Development and validation of a deep learning model for prediction of severe outcomes in suspected COVID-19 Infection. Preprint at (2021). https://arxiv.org/abs/2103.11269 Lyons, C. & Callaghan, M. The use of high-flow nasal oxygen in COVID-19. , 843–847 (2020). Anaesthesia 75 Whittle, J. S., Pavlov, I., Sacchetti, A. D., Atwood, C. & Rosenberg, M. S. Respiratory support for adult patients with COVID-19. , 95–101 (2020). J. Am. Coll. Emerg. Physicians Open 1 Ai, J., Li, Y., Zhou, X. & Zhang, W. COVID-19: treating and managing severe cases. , 370–371 (2020). Cell Res. 30 Esteva, A. et al. A guide to deep learning in healthcare. , 24–29 (2019). Nat. Med. 25 Cahan, E. M., Hernandez-Boussard, T., Thadaney-Israni, S. & Rubin, D. L. Putting the data before the algorithm in big data addressing personalized healthcare. , 78 (2019). NPJ Digit. Med. 2 Thrall, J. H. et al. Artificial intelligence and machine learning in radiology: opportunities, challenges, pitfalls, and criteria for success. , 504–508 (2018). J. Am. Coll. Radiol. 15 Shilo, S., Rossman, H. & Segal, E. Axes of a revolution: challenges and promises of big data in healthcare. , 29–38 (2020). Nat. Med. 26 Gao, Y. & Cui, Y. Deep transfer learning for reducing health care disparities arising from biomedical data inequality. , 5131 (2020). Nat. Commun. 11 Rieke, N. et al. The future of digital health with federated learning. , 119 (2020). NPJ Dig. Med. 3 Yang, Q., Liu, Y., Chen, T. & Tong, Y. Federated machine learning: concept and applications. , 12 (2019). ACM Trans. Intell. Syst. Technol. 10 Ma, C. et al. On safeguarding privacy and security in the framework of federated learning. , 242–248 (2020). IEEE Netw. 34 Brisimi, T. S. et al. Federated learning of predictive models from federated Electronic Health Records. , 59–67 (2018). Int. J. Med. Inform. 112 Roth, H. R. et al. Federated learning for breast density classification: a real-world implementation. In , (eds. Albarqouni, S. et al.) Vol. 12,444, 181–191 (Springer International Publishing, 2020). Proc. Second MICCAI Workshop, DART 2020 and First MICCAI Workshop, DCL 2020 Domain Adaptation and Representation Transfer, and Distributed and Collaborative Learning Sheller, M. J. et al. Federated learning in medicine: facilitating multi-institutional collaborations without sharing patient data. , 12598 (2020). Sci. Rep. 10 Remedios, S. W., Butman, J. A., Landman, B. A. & Pham, D. L. in (eds Remedios, S. W. et al.) (Springer, 2020). Federated Gradient Averaging for Multi-Site Training with Momentum-Based Optimizers Xu, Y. et al. A collaborative online AI engine for CT-based COVID-19 diagnosis. Preprint at (2020). https://www.medrxiv.org/content/10.1101/2020.05.10.20096073v2 Raisaro, J. L. et al. SCOR: A secure international informatics infrastructure to investigate COVID-19. , 1721–1726 (2020). J. Am. Med. Inform. Assoc. 27 Vaid, A. et al. Federated learning of electronic health records to improve mortality prediction in hospitalized patients with COVID-19: machine learning approach. , e24207 (2021). JMIR Med. Inform. 9 Nino, G. et al. Pediatric lung imaging features of COVID-19: a systematic review and meta-analysis. , 252–263 (2021). Pediatr. Pulmonol. 56 Fredrikson, M., Jha, S. & Ristenpart, T. Model inversion attacks that exploit confidence information and basic countermeasures. In 1322–1333, (2015). Proc. 22nd ACM SIGSAC Conference on Computer and Communications Security https://doi.org/10.1145/2810103.2813677 Zhu, L., Liu, Z. & Han, S. in (eds Wallach, H. et al.) 14774–14784 (Curran Associates, Inc., 2019). Advances in Neural Information Processing Systems 32 Kaissis, G. A., Makowski, M. R., Rückert, D. & Braren, R. F. Secure, privacy-preserving and federated machine learning in medical imaging. , 305–311 (2020). Nat. Mach. Intell. 2 Li, W. et al. in 133–141 (Springer, 2019). Privacy-Preserving Federated Brain Tumour Segmentation Shokri, R. & Shmatikov, V. Privacy-preserving deep learning. In (2015). Proc. 53rd Annual Allerton Conference on Communication, Control, and Computing (Allerton) https://doi.org/10.1109/allerton.2015.7447103 Li, X. et al. Multi-site fMRI analysis using privacy-preserving federated learning and domain adaptation: ABIDE results. , 101765 (2020). Med. Image Anal. 65 Estiri, H. et al. Predicting COVID-19 mortality with electronic medical records. , 15 (2021). NPJ Dig. Med. 4 Jiang, G. et al. Harmonization of detailed clinical models with clinical study data standards. , 65–74 (2015). Methods Inf. Med. 54 Yang, D. et al. in . (2019). Searching Learning Strategy with Reinforcement Learning for 3D Medical Image Segmentation https://doi.org/10.1007/978-3-030-32245-8_1 Elsken, T., Metzen, J. H. & Hutter, F. Neural architecture search: a survey. , 1–21 (2019). J. Mach. Learning Res. 20 Yao, Q. et al. Taking human out of learning applications: a survey on automated machine learning. Preprint at (2019). https://arxiv.org/abs/1810.13306 Ioffe, S. & Szegedy, C. Batch normalization: accelerating deep network training by reducing internal covariate shift. In , PMLR , 448–456 (2015). Proc. 32nd International Conf. Machine Learning 37 Kaufman, S., Rosset, S. & Perlich, C. Leakage in data mining: formulation, detection, and avoidance. In , 556–563 (2011). Proc. 17th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining Zhang, C. et al. BatchCrypt: efficient homomorphic encryption for cross-silo federated learning. In , 493–506 (2020). Proc. 2020 USENIX Annual Technical Conference, ATC 2020 . (2020). Nvidia NGC Catalog: COVID-19 Related Models https://ngc.nvidia.com/catalog/models?orderBy=scoreDESC&pageNumber=0&query=covid&quickFilter=models&filters Marini, J. J. & Gattinoni, L. Management of COVID-19 respiratory distress. , 2329–2330 (2020). JAMA 323 Cook, T. M. et al. Consensus guidelines for managing the airway in patients with COVID-19: Guidelines from the Difficult Airway Society, the Association of Anaesthetists the Intensive Care Society, the Faculty of Intensive Care Medicine and the Royal College of Anaesthetist. , 785–799 (2020). Anaesthesia 75 Galloway, J. B. et al. A clinical risk score to identify patients with COVID-19 at high risk of critical care admission or death: an observational cohort study. , 282–288 (2020). J. Infect. 81 Kilaru, A. S. et al. Return hospital admissions among 1419 COVID-19 patients discharged from five U.S. emergency departments. , 1039–1042 (2020). Acad. Emerg. Med. 27 He, K., Zhang, X., Ren, S. & Sun, J. Deep residual learning for image recognition. In (2016). Proc. 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR) https://doi.org/10.1109/cvpr.2016.90 Irvin, J. et al. CheXpert: a large chest radiograph dataset with uncertainty labels and expert comparison. , 590–597 (2019). Proc. AAAI Conf. Artif. Intell. 33 Wang, R., Fu, B., Fu, G. & Wang, M. Deep & Cross network for Ad Click predictions. In Article no. 12 (2017). Proc. ADKDD’17 Abadi, M. et al. TensorFlow: asystem for large-scale machine learning. In , USENIX Association 265–283 (2016). 12th USENIX Symposium on Operating Systems Design and Implementation (OSDI 16) . (2020). NVIDIA Clara Imaging https://developer.nvidia.com/clara-medical-imaging Stekhoven, D. J. & Bühlmann, P. MissForest–non-parametric missing value imputation for mixed-type data. , 112–118 (2012). Bioinformatics 28 McMahan, H., Moore, E., Ramage, D., Hampson, S. & y Arcas, B. A. Communication-efficient learning of deep networks from decentralized data. (2017). http://proceedings.mlr.press/v54/mcmahan17a.html Hsieh, K., Phanishayee, A., Mutlu, O. & Gibbons, P. B. The non-IID data quagmire of decentralized machine learning. In PMLR 119 (2020). Proc. 37th International Conf. Machine Learning Robin, X. et al. pROC: an open-source package for R and S+ to analyze and compare ROC curves. , 77 (2011). BMC Bioinformatics 12 Atzinības MGB pateicas šādām personām par atbalstu: J. Brink, Radioloģijas departaments, Massachusetts General Hospital, Boston, MA; N. Guo, Center for Advanced Medical Computing and Analysis, Department of Radiology, Massachusetts General Hospital, Department of Radiology, Massachusetts General Hospital, Harvard Medical School, Boston, MA; MA; MA; J. K. Cramer, Direktors Clinical Data Science, Massachusetts General Brigham, Boston, MA; T. Schultz, Department of Radiology, Massachusetts General Hospital, Boston, MA; N. Guo, Center for Advanced Medical Computing and Analysis, Department of Radiology, Massachusetts General Hospital, Harvard Medical School, Boston, MA; MA; MA J. K. Cramer, direktors, QTIM laboratorija Athlino Harvard A. Martinos Center for Biomical Imaging at MGH; S. Ar Medicīnas fakultātes starpniecību Čulalongkornas Universitāte pateicas Ratchadapisek Sompoch Endowment Fund RA (PO) (nr. 001/63) par klīnisko datu un bioloģisko paraugu, kas saistīti ar COVID-19, vākšanu un pārvaldību pētniecības darba grupai, Medicīnas fakultātei, Čulalongkornas Universitātei. NIHR Cambridge Biomedicīnas pētniecības centrs pateicas A. Priestam, kuru atbalsta NIHR (Kambridžas Biomedicīnas pētniecības centrs Kembridžas Universitātes slimnīcu NHS fonda fondā). Nacionālais Taivānas Universitātes MeDA Lab un MAHC un Taivānas Nacionālā veselības apdrošināšanas administrācija pateicas MOST kopīgajam pētniecības centram AI tehnoloģijai, All Vista https://data.ucsf.edu/covid19 Šis dokuments ir pieejams dabā saskaņā ar CC by 4.0 Deed (attribution 4.0 International) licenci. Šis dokuments ir Attiecības ir licencētas saskaņā ar CC by 4.0 Deed (Attribution 4.0 International) licenci. Pieejams dabā