AI mpya ya kwanza ya faragha inatarajia uzito wa COVID kwa kutumia X-ray na kumbukumbu za matibabu

Waandishi wa: Ittai Dayan Holger R. Roth Aoxiao Zhong Ahmed Haruni wa Amilcare kwa wema Anas Z. Abidin Andrew Liu wa Anthony Beardsworth wa Costa Maelezo ya Bradford J. Wood Chien-Sung Tsai Maisha ya Chih-Hung Wang Chun-Nan Hsu C. K. Lee Maelezo ya Ruan Msisemi Shukrani Dufan wa Eddie Huang Felipe Campos Kitamura Msichana wa Lacey Gustavo César de Antônio Corradi Mwakyembe Nino Hao-Hsin Shin Hirofumi Obinata Mimi ni Ren Jason C. Crane Jesse Tetreault Jiahui ya Guan wa John W. Garrett Joshua D. Kaggie Jung Gil Park Maelezo ya Dreyer Krishna Mwakyembe Kristo Mtakatifu Marcio Aloisio Bezerra Cavalcanti Rockenbach Marius George Linguraru Masoom A. Haider Meena AbdelMaseeh Nicola Rieke Pablo F. Damasceno Pedro Mario Cruz e Silva Pochuan Wang Sheng Xu Shukrani kwa Kawano Sira Sriswasdi Mfano wa Young Park Thomas M. Grist Varun Buch Watsamon Jantarabenjakul Weichung Wang Won Young Tak Mwakyembe Li Xihong Lin Young Joon Kwon Abood Quraini Andrew Feng Andrew N. Priest Baris Turkbey Benjamin Glicksberg Bernardo Bizzo Byung Seok Kim Carlos Tor-Díez Chia-Cheng Lee Chia-Jung Hsu Chin Lin Chiu-Ling Lai Christopher P. Hess Colin Compas Deepeksha Bhatia Eric K. Oermann Evan Leibovitz Hisashi Sasaki Maisha ya Hitoshi Isaac Yang Jae Ho Sohn Krishna Nand Keshava Murthy Li-Chen Fu Matheus Ribeiro Furtado de Mendonça Mike Fralick Min Kyu Kang Mohammad Adil Natalie Gangai Peerapon Vateekul Pierre Elnajjar Sarah Hickman Sharmila Majumdar Shelley L. McLeod Sheridan Reed Stefan Gräf Stephanie Harmon Tatsuya Kodama Thanyawee Puthanakit Tony Mazzulli Vitor Lima de Lavor Yothin Rakvongthai Yu Rim Lee Yuhong Wen Fiona J. Gilbert Mona G. Flores Quanzheng Li Waandishi wa: Maisha ya Dayan Mwandishi wa R. Roth Mwakyembe wa Zhong Ahmed Haruni wa Amilcare kwa wema Anas Z. Abidin Andrew Liu wa Anthony Beardsworth wa Costa Maelezo ya Bradford J. Wood Msisemi Shaykh Rabiy ́ Maisha ya Chih-Hung Wang Msisemi Shaykh Rabiy ́ ni Kwa mujibu wa C.K Lee Maelezo ya Ruan Msisemi Shukrani Dufan wa Mke wa Huang Felipe Campos wa Kitamura Msichana wa Lacey Gustavo César wa Antonio Corradi Mwakyembe Nino Msisemi Shimoni Hirofumi ya Obinata Mimi ni Ren Jason C. Mwakyembe Jesse Tetreault kwa ujumla Jiahui ya Guan wa John W. Garrett Joshua D. Kaggie kwa ujumla Uwanja wa Jung Gil Maelezo ya Dreyer Krishna Mwakyembe Kristo Mtakatifu Marcio Aloisio Bezerra Cavalcanti wa Rockenbach Marius George wa Linguraru Masoom A. Haider Msisemi Shaykh Rabiy ́ ni Imaam Nyota wa Rieke Pablo F. Damasceno wa Ujerumani Pedro Mario Cruz na Silva Maana ya Wang Msisemi Shukrani Shukrani kwa Kawano Mke wa Kijiji Mfano wa Young Park Thomas M. Mwakyembe vitabu vya Chakula cha chakula cha mchana Mwakyembe Wang Mzazi wa Young Tak Mwakyembe Li Msimamizi wa Lin Msichana wa Joon Kwon Msisemi Shaykh Rabiy ́ Andrew wa Feng Andrew N. Priest kwa ujumla Ulinzi wa Turkbey Benjamin Glicksberg kwa ajili ya Maelezo ya Bernardo Bizzo Msisemi Shaykh Rabiy ́ ni Imaam wa Jarh Carlos Tor-Díez kwa ajili ya Maoni ya Chia-Cheng Lee Mji wa Chia-Jung Hsu Jinsi ya Lin Mji wa Chiu-Ling Lai Maoni ya Christopher P. Hess Kocha wa Compas Mshambuliaji wa Bhatia Kwa mujibu wa Eric K. Oermann Mwandishi wa Leibovitz Mwakyembe wa Sasaki Maisha ya Hitoshi Isaac wa Mtoto wa Krishna Nand Keshava wa Murthy Maana ya Fu Matheus Ribeiro Furtado ya Mendonça Kiongozi wa Fralick Maisha ya Kyu Kang Mahakama ya Adil Nyota wa Gangai Msisemi Shukrani kwa Shukrani Pierre Mwakyembe Mke wa Sarah Hickman Sharmila Majumdar Shelley L. McLeod kwa ujumla Sherehe ya Reed Stefan Mwakyembe Maisha ya Harmon Tatsuya Kodawa Msisemi Shukrani kwa Shukrani Tony Mwakyembe Vitor Lima wa Kazi Msisemi Shaykh Rabiy ́ ni Imaam wa Msimamizi wa Lee Maana ya Wen Maoni ya Fiona J. Gilbert Mona G. Maua Msimamo wa Li Abstract ya Hapa tunatumia data kutoka vyuo vikuu 20 kote ulimwenguni kufundisha mfano wa FL, inayoitwa EXAM (Electronic Medical Record (EMR) chest X-ray AI model), ambayo inapendekeza mahitaji ya baadaye ya oksijeni ya wagonjwa wanaosababishwa na COVID-19 kwa kutumia data ya ndani ya ishara muhimu, data ya maabara na x-ray chest. EXAM ilipata eneo la wastani chini ya mwongozo (AUC) >0.92 kwa kutabiri matokeo katika masaa 24 na 72 kutoka wakati wa uwasilishaji wa awali kwa chumba cha dharura, na ilitoa 16% kuboresha wastani wa AUC kupimwa katika maeneo yote yaliyoshiriki na ongezeko la wastani wa ubunifu wa 38% ikilinganishwa na mifano maalum iliyohitajika Mkuu wa Jumuiya za sayansi, sayansi, matibabu na sayansi ya data zimekusanyika pamoja mbele ya mgogoro wa COVID-19 kwa haraka kutathmini paradigms mpya katika akili ya kiufundi (AI) ambayo ni ya haraka na salama, na uwezekano wa kuchochea kushiriki data na mafunzo ya mfano na majaribio bila vikwazo vya kawaida vya faragha na mamlaka ya data ya ushirikiano wa jadi. , Wafanyabiashara wa huduma za afya, watafiti na sekta ya viwanda wamebadili lengo la kukabiliana na mahitaji yasiyotimizwa na muhimu ya kliniki yaliyoundwa na mgogoro, na matokeo ya kushangaza. , , , , , , Uteuzi wa majaribio ya kliniki umepangwa na kuwezeshwa na mashirika ya kudhibiti ya kitaifa na roho ya ushirikiano wa kimataifa , , Uchambuzi wa data na masomo ya AI daima yamehamasisha mbinu za wazi na za ushirikiano, zinashughulikia dhana kama vile programu ya chanzo cha wazi, utafiti unaoweza kurejeshwa, hifadhi za data, na kufanya seti za data zinazojulikana zinapatikana kwa umma. , Ugonjwa huu umeonyesha haja ya kuendesha kwa haraka ushirikiano wa data ambao unawezesha jumuiya za kliniki na kisayansi wakati wa kujibu changamoto za haraka zinazoendelea na za kimataifa. kushiriki data ina ugumu wa kimaadili, sheria na kisheria ambazo zinaonyeshwa, na pengine ni ngumu kidogo, na kuingia hivi karibuni kwa makampuni makubwa ya teknolojia katika ulimwengu wa data ya afya. , , . 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 Mfano halisi wa aina hizi za ushirikiano ni kazi yetu ya awali juu ya mfano wa msaada wa uamuzi wa kliniki wa SARS-COV-2 (CDS) unaounganishwa na AI. Mfano huu wa CDS ulifanywa katika Mass General Brigham (MGB) na ulihesabiwa juu ya data ya mifumo mingi ya afya. Matoleo ya mfumo wa CDS yalikuwa picha za X-ray za chuma (CXR), ishara muhimu, data ya idadi ya watu na thamani za maabara ambazo zilionyeshwa katika machapisho ya awali kuwa na utabiri wa matokeo ya wagonjwa wenye COVID-19 , , , CXR ilichaguliwa kama ufungaji wa picha kwa sababu inapatikana sana na kwa kawaida inajulikana na miongozo kama vile yale yaliyotolewa na ACR Jamii ya Fleischner Kwa mujibu wa WHO Mashirika ya Taifa ya Thoracic Wizara ya Afya ya Taifa, mikopo ya COVID na vyama vya radiolojia duniani kote Matokeo ya mfano wa CDS ilikuwa alama, inayoitwa CORISK , ambayo inahusiana na mahitaji ya msaada wa oksijeni na ambayo inaweza kusaidia katika uchunguzi wa wagonjwa na madaktari wa mbele , , Wafanyabiashara wa huduma za afya wamefahamika wanapendelea mifano ambayo yalikuwa yamethibitishwa kwa data zao wenyewe Hadi sasa, mifano mingi ya AI, ikiwa ni pamoja na mfano wa CDS hapo juu, imekuwa ya mafunzo na kuthibitishwa juu ya data 'huru' ambayo mara nyingi haina utofauti. , uwezekano wa kusababisha overfitting na chini generalizability. hii inaweza kupunguzwa kwa mafunzo na data mbalimbali kutoka maeneo mengi bila centralization ya data kutumia mbinu kama vile kujifunza uhamisho , FL ni mbinu inayotumika kufundisha mifano ya AI juu ya vyanzo tofauti vya data, bila data kuhamishwa au kupatikana nje ya eneo lao la awali. Ingawa inatumika kwa viwanda vingi, FL imekuwa hivi karibuni iliyopendekezwa kwa utafiti wa huduma za afya kati ya taasisi . 18 19 20 21 22 23 24 25 26 27 28 29 30 27 31 32 33 34 35 36 Kuunganishwa kwa kujifunza inasaidia kuanzisha haraka majaribio ya kikanda na ufuatiliaji bora wa data na tathmini ya mabadiliko ya algorithm na athari Njia moja ya FL, inayojulikana kama client-server, inatuma mfano wa 'untrained' kwa seva zingine ('nodes') zinazofanya kazi za mafunzo ya sehemu, na kwa upande wake inatuma matokeo kurudi kuunganishwa kwenye seva ya kati ('federated') Hii inafanywa kama mchakato wa iterative mpaka mafunzo imekamilika . 37 36 Utawala wa data kwa FL unahifadhiwa ndani, kupunguza wasiwasi wa faragha, na viwango vya mfano tu au gradients zinawasiliana kati ya maeneo ya mteja na seva ya shirikisho , FL tayari imeonyesha ahadi katika maombi ya hivi karibuni ya picha ya matibabu , , , katika uchambuzi wa COVID-19 , , Mfano mzuri ni mfano wa utabiri wa vifo kwa wagonjwa walioambukizwa na SARS-COV-2 ambao hutumia sifa za kliniki, ingawa ni mdogo kwa idadi ya njia na kiwango. . 38 39 40 41 42 43 8 44 45 46 Lengo letu lilikuwa kuendeleza mfano mzuri, unaoweza kuzingatiwa ambayo inaweza kusaidia katika uchunguzi wa wagonjwa. Tulipata nadharia kwamba mfano wa CDS unaweza kuunganishwa kwa ufanisi, kutokana na matumizi yake ya data inapatikana ambayo ni ya kawaida katika mazoezi ya kliniki na ambayo haina kutegemea sana juu ya tathmini ya operesheni-kutegemea hali ya mgonjwa (kama vile hisia za kliniki au dalili zilizotajwa). Badala yake, matokeo ya maabara, ishara muhimu, utafiti wa picha na idadi ya idadi ya watu (yaani, umri), walikuwa kutumika. Kwa hiyo tulijaribu tena mfano wa CDS na data mbalimbali kwa kutumia mbinu ya FL ya mteja-server ili kuendeleza mfano mpya wa FL wa kimataifa, ambayo ilitajwa EXAM, kwa kutumia Madhumuni yetu ilikuwa kwamba EXAM itakuwa bora kuliko mifano ya ndani na itakuwa ya kawaida zaidi katika mifumo ya afya. Matokeo ya Mfumo wa Mfumo wa Mtihani Mfano wa EXAM unategemea mfano wa CDS uliotajwa hapo juu Kwa jumla, vipengele 20 (19 kutoka EMR na moja kutoka CXR) vilitumiwa kama vipengele vya kuingia kwa mfano. Kazi ya matokeo (yaani, 'ukweli wa ardhi') ilichaguliwa kulingana na matibabu ya oksijeni kwa wagonjwa baada ya muda wa masaa ya 24 na 72 kutoka kwa upatikanaji wa awali kwa idara ya dharura (ED). Orodha ya kina ya vipengele na matokeo yanayohitajika inaweza kuonekana katika Meza . 27 1 Orodha ya matibabu ya oksijeni ilikuwa, kulingana, hewa ya chumba (RA), oksijeni ya chini ya mtiririko (LFO), oksijeni ya juu ya mtiririko (HFO)/utunzaji wa noninvasive (NIV) au utunzaji wa kiufundi (MV). Ikiwa mgonjwa alikufa ndani ya dirisha la utabiri, alama ya matokeo iliwekwa kwa 1. Hii ilisababisha kila kesi kuwa na alama mbili katika kiwango cha 0-1 kulingana na kila moja ya dirisha la utabiri (yaani, 24 na 72 h). Kwa vipengele vya EMR, tu thamani za kwanza zilizokusanywa katika ED zilitumiwa na usindikaji wa kabla ya data ulihusisha deidentification, imputation ya thamani iliyopo na normalization kwa wastani wa zero na variance ya kipengele. Kwa hiyo, mfano unajumuisha habari kutoka kwa vipengele vya EMR na CXR, kwa kutumia mtandao wa neural wa 34 (ResNet34) kuondoa vipengele kutoka kwa CXR na mtandao wa Deep & Cross ili kuunganisha vipengele pamoja na vipengele vya EMR (kwa maelezo zaidi, angalia Matokeo ya mfano ni alama ya hatari, inayojulikana kama alama ya EXAM, ambayo ni thamani ya kuendelea katika kiwango cha 0-1 kwa kila moja ya utabiri wa masaa ya 24 na 72 unaofaa kwa alama zilizotajwa hapo juu. Njia ya Ushirikiano wa Mfano Mfano wa EXAM ulifundishwa kwa kutumia kundi la kesi 16,148, na kuifanya si tu miongoni mwa mifano ya kwanza ya FL kwa COVID-19 lakini pia mradi mkubwa sana wa maendeleo ya multicontinental katika AI inayohusiana na kliniki (Kielelezo. Data kati ya maeneo haikuwa harmonized kabla ya uchimbaji na, kwa kuzingatia hali halisi ya maisha ya kliniki informatics, usanifu wa kina wa kuingia data haikufanywa na waandishi (Kielelezo. (Kwa ajili ya 1A na B 1C ya D , ramani ya dunia ambayo inaonyesha maeneo tofauti ya wateja 20 yanayochangia utafiti wa EXAM. Idadi ya kesi zinazotolewa na kila taasisi au tovuti (client 1 inawakilisha tovuti ambayo inawakilisha idadi kubwa ya kesi). Chest X-ray usambazaji wa nguvu katika kila tovuti ya mteja. , Umri wa wagonjwa katika kila tovuti ya mteja, kuonyesha umri mdogo na wa juu (asterisks), umri wa wastani (tatu) na upungufu wa kiwango (bars horizontal). idadi ya sampuli ya kila tovuti ya mteja inaonyeshwa katika Meza ya ziada . a b c d 1 Utafiti uliofanywa na shirika la Utafiti wa Utafiti wa Utafiti wa Utafiti wa Utafiti wa Utafiti wa Utafiti wa Utafiti wa Utafiti wa Utafiti ( 1 × 10–3, jaribio la Wilcoxon lililoandikwa) la 16% (kama ilivyofafanuliwa na AUC ya wastani wakati wa kuendesha mfano kwenye seti zao za mtihani wa ndani: kutoka 0.795 hadi 0.920, au pointi za asilimia 12.5) (Mfano. Pia ilisababisha kuboresha kwa 38% kwa ufanisi (kama ilivyoelezwa na AUC ya wastani wakati wa kuendesha mfano kwenye seti zote za mtihani: kutoka 0.667 hadi 0.920, au pointi za asilimia 25.3) ya mfano bora wa kimataifa kwa utabiri wa matibabu ya oksijeni ya saa 24 ikilinganishwa na mifano iliyofundishwa tu juu ya data ya tovuti yenyewe (Kielelezo. Kwa matokeo ya utabiri wa matibabu ya oksijeni ya saa 72, mafunzo bora ya mifano ya kimataifa yalisababisha kuboresha utendaji wa wastani wa 18% ikilinganishwa na mifano ya mafunzo ya ndani, wakati ubunifu wa mfano wa kimataifa uliboresha kwa wastani wa 34% (Tafadhali Data Fig. Usalama wa matokeo yetu ulithibitishwa kwa kurudia kozi tatu za mafunzo ya ndani na FL juu ya vipande tofauti vya data za randomized. P 2a ya 2B ya 1 , Ufanisi katika mtihani wa kila mteja unaoundwa katika utabiri wa matibabu ya oksijeni ya saa 24-kwa ajili ya mifano iliyoundwa kwa data ya ndani tu (Local) ikilinganishwa na ile ya mfano bora wa kimataifa unaopatikana kwenye seva (FL (tazama bora). , Generalizability (mafanikio ya wastani kwenye data ya majaribio ya maeneo mengine, kama ilivyoelezwa na AUC ya wastani) kama utendaji wa ukubwa wa dataset ya mteja (hata kesi). mstari wa kijani unaonyesha utendaji wa generalizability wa mfano bora wa kimataifa. ) na mteja wa 14 alikuwa na kesi tu na matibabu ya RA, hivyo takwimu ya tathmini (kwa AUC) haipatikani katika yoyote ya kesi hizi ( Takwimu za mteja 14 pia zilifutwa kutoka kwa hesabu ya kawaida ya wastani katika mifano ya ndani. a b 1 Njia ya Mifano ya mitaa ambayo ilifundishwa kwa kutumia cohorts isiyo na usawa (kwa mfano, kesi nyingi za kupendeza za COVID-19) ilipokea faida kubwa kutoka kwa mbinu ya FL, na kuboresha kwa kiasi kikubwa katika ufanisi wa AUC wastani wa utabiri kwa makundi yenye kesi chache tu. Hii ilikuwa dhahiri kwenye tovuti ya mteja 16 (seti ya data isiyo na usawa), na wagonjwa wengi wanaopitia ugonjwa mdogo na na matukio machache makubwa tu. Mfano wa FL ulipata kiwango cha juu cha kweli na chanya kwa matukio mawili mazuri (maumivu) na kiwango cha chini sana cha uongo-maumivu ikilinganishwa na mfano wa mitaa, wote kuonyeshwa katika ROC (Receiver Operating Characteristic) plot na matishi ya na data ya kuendeleza. Jambo la muhimu zaidi, ufungaji wa mfano wa FL uliongezeka kwa kiasi kikubwa juu ya mfano wa mafunzo ya ndani. 3a ya 2 , ROC kwenye tovuti ya mteja 16, na data isiyo na usawa na kesi nyingi ndogo. ROC ya mfano wa mitaa kwenye eneo la mteja 12 (tathmini ndogo), ROC ya wastani ya mifano iliyoandaliwa kwenye seti kubwa za data zinazohusiana na maeneo mitano ya mteja katika eneo la Boston (1, 4, 5, 6, 8) na ROC ya mfano bora wa kimataifa katika utabiri wa matibabu ya oksijeni kwa masaa 72 kwa viwango tofauti vya Tathmini ya EXAM (kulia, katikati, kulia). ROC ya wastani inategemea mifano mitano iliyoandaliwa ndani wakati eneo la kijivu linaonyesha upungufu wa kiwango cha ROC. Pos na neg kuelezea idadi ya kesi chanya na hasi, kwa mujibu wa ufafanuzi huu wa scale ya EXAM. a b t Katika kesi ya maeneo ya wateja na seti ndogo ya data, mfano bora wa FL ulikuwa unaonyesha bora si tu mfano wa ndani lakini pia wale walijifunza juu ya seti kubwa ya data kutoka maeneo ya wateja tano katika eneo la Boston ya Marekani (Fig. (Kwa ajili ya 3B ya Mfano wa kimataifa ulifanya vizuri katika kutabiri mahitaji ya oksijeni kwa saa 24/72 kwa wagonjwa wote COVID chanya na hasi (Data Extended Fig. ). 3 Utambulisho katika maeneo ya kujitegemea Baada ya mafunzo ya awali, EXAM baadaye ilifanyiwa majaribio katika maeneo matatu ya kuthibitisha ya kujitegemea: Hospitali ya Cooley Dickinson (CDH), Hospitali ya Martha's Vineyard (MVH) na Hospitali ya Nantucket Cottage (NCH), wote huko Massachusetts, Marekani. , na mwongozo wa ROC na matrix ya mchanganyiko kwa seti kubwa ya data (kutoka CDH) ni kuonyeshwa katika Fig. . The operating point was set to discriminate between nonmechanical ventilation and mechanical ventilation (MV) treatment (or death). The FL global trained model, EXAM, achieved an average AUC of 0.944 and 0.924 for 24- and 72-h prediction tasks, respectively (Table Kwa utabiri wa matibabu ya MV (au kifo) kwa saa 24, EXAM ilipata hisia ya 0.950 na usahihi wa 0.882 kwa CDH, na usahihi wa 1000 usahihi wa 0.934 kwa MVH. NCH hakuwa na kesi yoyote na MV / kifo kwa saa 24. Kuhusu utabiri wa 72-h MV, EXAM ilipata hisia ya 0.929 na usahihi wa 0.880 kwa CDH, usahihi wa 1.000 na usahihi wa 0.976 kwa MVH na usahihi wa 1.000 na usahihi wa 0.929 kwa NCH. 2 4 2 , Kwa mujibu wa jarida la tiba ya sayansi, sensa zilizopo katika mkono huo bandia hutumiwa kutuma ishara moja kwa moja katika mwili. ( (Kwa muda wa saa kumi na nne) (Tafakari ya ROC kwa viwango tofauti vya kupunguzwa) ) ya matokeo ya hatari ya mtihani yanaonyeshwa. a b a b t Kwa MV katika CDH katika masaa ya 72, EXAM ilikuwa na kiwango cha chini cha uongo-mzito wa 7.1%. matukio ya kushindwa ya uwakilishi yamewasilishwa katika Kielelezo cha Data ya Kuongezeka. , ambayo inaonyesha kesi mbili za uongo-mzuri kutoka kwa CDH ambapo kesi moja ilikuwa na vipengele vingi vya data vya EMR zilizopo na nyingine ilikuwa na CXR na artefact ya harakati na baadhi ya vipengele vya EMR zilizopo. 4 Matumizi ya faragha tofauti Sababu kuu kwa taasisi za afya kutumia FL ni kuhifadhi usalama na faragha ya data zao, pamoja na ufuatiliaji wa hatua za ufuatiliaji wa data. au hata kurejesha picha za mafunzo kutoka kwa gradients za mfano wenyewe Ili kukabiliana na hatari hizi, hatua za kuboresha usalama zimetumika kupunguza hatari katika kesi ya data 'kutibu' wakati wa mawasiliano ya tovuti-server Tumefanya majaribio na mbinu za kuepuka kupiga marufuku data ya FL, na kuongeza kipengele cha usalama ambacho tunaamini kinaweza kuchochea taasisi zaidi kutumia FL. Kwa hiyo tumeidhinisha matokeo ya awali ambayo yanaonyesha kuwa usambazaji wa sehemu wa uzito, na mbinu zingine za faragha, zinaweza kutumika kwa ufanisi katika FL. Kwa njia ya uchunguzi wa mpango wa sehemu ya usambazaji , , , tulionyesha kuwa mifano inaweza kufikia utendaji wa kulinganisha hata wakati tu 25% ya update ya uzito inashirikiwa (Extended Data Fig. (Kwa ajili ya 47 48 49 50 50 51 52 5 Mjadala wa Utafiti huu unajumuisha utafiti mkubwa wa dunia halisi wa afya FL kwa idadi ya maeneo na idadi ya pointi za data zinazotumiwa. Tunaamini kwamba inatoa ushahidi mkubwa wa dhana ya uwezekano wa kutumia FL kwa maendeleo ya haraka na ya ushirikiano wa mifano inayohitajika ya AI katika huduma za afya. Utafiti wetu ulihusisha maeneo kadhaa katika mabara nne na chini ya usimamizi wa mashirika mbalimbali ya udhibiti, na hivyo ina ahadi ya kutolewa kwa masoko tofauti yaliyoundwa kwa njia ya haraka. Mfano wa FL wa kimataifa, EXAM, ulionyesha kuwa imara na kufikia matokeo bora kwenye maeneo tofauti kuliko mifano yoyote iliyohitajika kwenye data ya ndani tu. Tunaamini kuwa kuboresha kwa utaratibu ulifanyika kwa sababu ya data kubwa lakini pia tofauti, matumizi ya data Kwa tovuti ya mteja na dataset ndogo, mbinu mbili za kawaida zinaweza kutumika ili kuunganisha mfano muhimu: moja ni mafunzo ya ndani na data yake mwenyewe, nyingine ni kutumia mfano uliofundishwa juu ya dataset kubwa. Kwa tovuti na dataset ndogo, itakuwa karibu haiwezekani kujenga mfano wa kujifunza kinachofanya kazi kwa kutumia data zao za ndani tu. Ukweli kwamba mbinu hizi mbili zilikuwa zinafanikiwa zaidi katika kazi zote tatu za utabiri na mfano wa FL wa kimataifa, inaonyesha kwamba faida kwa tovuti za mteja na dataset ndogo zinazozalishwa na ushiriki katika ushirikiano wa FL ni kubwa. Hii ni uwezekano wa kutafakari uwezo wa FL kukamata utofauti zaidi kuliko mafunzo ya ndani, na kupunguza upendeleo wa sasa katika mifano zilizofundishwa juu ya idadi ya homogenous. chini ya . 46 Matokeo ya kuthibitisha kuwa mfano wa kimataifa ni imara, kuunga mkono hypothesis yetu kwamba mifano ya FL-kufundishwa ni ya kawaida katika mifumo ya huduma ya afya. Wao hutoa kesi ya kuvutia kwa matumizi ya algorithms ya utabiri katika huduma ya wagonjwa ya COVID-19, na matumizi ya FL katika uumbaji wa mifano na majaribio. Kwa kushiriki katika utafiti huu maeneo ya wateja walipata upatikanaji wa EXAM, ili kuthibitishwa zaidi kabla ya kufuatilia idhini yoyote ya udhibiti au uanzishwaji wa baadaye katika huduma ya kliniki. mipango ni katika njia ya kuthibitisha EXAM katika mipangilio ya 'uzalishaji' katika MGB kutumia rasilimali za lengo la COVID-19 pamoja na katika maeneo mbalimbali ambayo hayakuwa sehemu ya mafunzo ya EXAM. 53 Zaidi ya mifano 200 ya utabiri ili kusaidia uamuzi katika wagonjwa na COVID-19 zimechapishwa Tofauti na idadi kubwa ya machapisho yaliyohusika katika uchambuzi wa COVID-19 au utabiri wa vifo, tulitabiri mahitaji ya oksijeni ambayo yana madhara kwa usimamizi wa wagonjwa. Pia tulitumia kesi ambazo hazijulikani SARS-COV-2 hali, na hivyo mfano inaweza kutoa ufumbuzi kwa daktari kabla ya kupokea matokeo ya PCR na reverse transcription (RT-PCR), na kufanya hivyo ni muhimu kwa mazingira halisi kliniki. ufumbuzi wa picha ya mfano hutumiwa katika mazoezi ya kawaida, kinyume na mifano ambayo hutumia chest computed tomography, mbinu ya uchambuzi isiyo na makubaliano. Muundo wa mfano ulikuwa mdogo kwa predictors halisi, kinyume na masomo mengi iliyochapishwa ambayo kutumia hisia za kliniki. Takwimu zilizokusanywa 19 Utambulisho wa cohort ya wagonjwa na usawa wa data sio masuala mapya katika utafiti na sayansi ya data , lakini ni ngumu zaidi, wakati wa kutumia FL, kutokana na ukosefu wa kuonekana kwenye seti za data za maeneo mengine. Mabadiliko ya mifumo ya habari ya kliniki yanahitajika kuboresha maandalizi ya data, kusababisha ufanisi bora wa mtandao wa maeneo yanayohusika katika FL. Hii, pamoja na uhandisi wa hyperparameter, inaweza kuruhusu algorithms 'kujifunza' kwa ufanisi zaidi kutoka kwa seti kubwa za data na kurekebisha vigezo vya mfano kwa tovuti fulani kwa ajili ya utambulisho zaidi - kwa mfano, kwa kuboresha zaidi kwenye tovuti hiyo. Mfumo ambao utaruhusu upungufu usio na utaratibu, karibu kwa muda halisi wa model inference na usindikaji wa matokeo pia utakuwa na manufaa na itakuwa 'kufungua mzunguko' kutoka mafunzo hadi utekelezaji wa mifano. 54 39 Kwa sababu data hazikuunganishwa, haiwezi kupatikana kwa urahisi.Kwa sababu hiyo, uchambuzi wowote wa matokeo ya baadaye, zaidi ya kile kilichopatikana na kukusanywa, ni mdogo. Kama vile mifano mingine ya kujifunza mashine, EXAM ni mdogo na ubora wa data ya mafunzo. Taasisi zinazohusika katika kutekeleza algorithm hii kwa ajili ya huduma za kliniki zinahitaji kuelewa vipengele vya uwezekano katika mafunzo. Kwa mfano, alama zilizotumika kama ukweli wa msingi katika mafunzo ya mfano wa EXAM zilitokana na matumizi ya oksijeni ya 24 na 72 h katika mgonjwa; inachukuliwa kwamba oksijeni iliyotolewa kwa mgonjwa inamaanisha mahitaji ya oksijeni. Hata hivyo, katika awamu ya kwanza ya COVID-19 pandemic, wagonjwa wengi walipewa oksijeni ya juu ya mtiririko bila kujali mahitaji yao ya oksijeni. Kwa kuwa upatikanaji wetu wa data ulikuwa mdogo, hatukuwa na habari za kutosha zinazopatikana kwa ajili ya kuzalisha takwimu za kina juu ya sababu za kushindwa, baada ya wakati, kwenye maeneo mengi. Hata hivyo, tulijifunza kesi za kushindwa kutoka kwa tovuti kubwa ya majaribio ya kujitegemea, CDH, na tumeweza kuzalisha hypotheses ambazo tunaweza kujaribu katika siku zijazo. Katika siku zijazo, tunatarajia pia kuchunguza uwezekano wa 'kuongezeka kwa idadi ya watu' kutokana na hatua tofauti za maendeleo ya ugonjwa.Tunaamini kwamba, kutokana na utofauti katika maeneo 20, hatari hii inaweza kupunguzwa. Kipengele kimoja ambacho kingeongeza aina hizi za ushirikiano wa kiwango kikubwa ni uwezo wa kutabiri mchango wa kila tovuti ya mteja kuelekea kuboresha mfano wa FL wa kimataifa. Hii itasaidia katika uteuzi wa tovuti ya mteja, na katika kuweka kipaumbele kwa ajili ya kukusanya data na juhudi za kuandika. Hili ni muhimu hasa kutokana na gharama kubwa na logistics ngumu ya jitihada hizi za kikundi kikubwa, na itawezesha jitihada hizi kukamata utofauti badala ya kiasi kikubwa cha sampuli za data. Future approaches may incorporate automated hyperparameter searching Utafutaji wa Neural Architecture na nyingine ya kujifunza mashine mbinu za kupata vigezo bora vya mafunzo kwa kila tovuti ya mteja kwa ufanisi zaidi. 55 56 57 Maswali yaliyojulikana ya normalization ya batch (BN) katika FL alisisitiza kurekebisha mfano wetu wa msingi wa uchimbaji wa picha Kazi ya baadaye inaweza kuchunguza aina tofauti za mbinu za kawaida ili kuruhusu mafunzo ya mifano ya AI katika FL kwa ufanisi zaidi wakati data ya mteja ni isiyo ya kujitegemea na imewekwa sawa. 58 49 Kazi ya hivi karibuni juu ya mashambulizi ya faragha ndani ya mipangilio ya FL imesababisha wasiwasi juu ya upatikanaji wa data wakati wa mafunzo ya mfano Wakati huo huo, algorithms ya ulinzi bado haijatambuliwa na kupunguzwa na mambo mengi. , , kuonyesha ulinzi mzuri, wanaweza kupunguza utendaji wa mfano. algorithms encryption, kama vile encryption homomorphic Jinsi ya kupima faragha itaruhusu chaguo bora kwa kuamua vigezo vidogo vya faragha zinazohitajika wakati wa kudumisha utendaji wa kliniki. , , . 59 36 48 49 60 36 48 49 Baada ya kuthibitisha zaidi, tunatazama utekelezaji wa mfano wa EXAM katika mazingira ya ED kama njia ya kutathmini hatari kwa kiwango cha kila mgonjwa na idadi ya idadi ya idadi ya watu, na kutoa daktari na msingi wa ziada wakati wa kufanya kazi mara nyingi ngumu ya uchunguzi wa wagonjwa. Tunatazama pia kutumia mfano kama kiwango cha idadi ya idadi ya idadi ya idadi ya idadi ya watu ili kusaidia usawa wa rasilimali kati ya mikoa, hospitali na idara. matumaini yetu ni kwamba juhudi sawa FL zinaweza kuvunja silos data na kuruhusu maendeleo ya haraka ya mifano muhimu ya AI katika siku za usoni. Njia ya Ushauri wa Maadili Maandalizi yote yaliyothibitishwa na Taasisi ya Afya ya California ya Canyland ilifanywa kwa mujibu wa kanuni za majaribio ya binadamu kama ilivyoelezwa katika Declaration ya Helsinki na Mkutano wa Kimataifa juu ya Harmonization ya Maelekezo ya Afya Bora ya Kliniki, na yameidhinishwa na bodi za uchunguzi wa taasisi zinazohusiana Beth Sinungner katika maeneo ya uhakiki zifuatazo: CDH, MVH, NCH na kwenye maeneo ya maelekezo yafuatayo: MGB, Hospitali ya Msingi (MGH), Hospitali ya Brigham na Wanawake, Hospitali ya Newton-Wellesley, Kituo cha Matibabu cha San Shore na Hospitali ya New Faulkner (kila hospitali nane zilizoidhinishwa katika Hospitali ya Taifa ya Watoto huko Washington, DC ( Maelekezo ya MI-CLAIM kwa taarifa ya mifano ya AI ya kliniki yamefuatiliwa (Kumbuka ) 2 Utafiti wa Setting Utafiti huo ulihusisha data kutoka kwa taasisi za 20 (Fig. ): MGB, MGH, Hospitali ya Brigham na Wanawake, Hospitali ya Newton-Wellesley, Kituo cha Matibabu cha North Shore na Hospitali ya Faulkner; Hospitali ya Taifa ya Watoto huko Washington, DC; Kituo cha Utafiti wa Biomedical cha NIHR Cambridge; Hospitali ya Kati ya Wanajeshi wa Ulinzi huko Tokyo; National Taiwan University MeDA Lab na MAHC na Taiwan National Health Insurance Administration; Hospitali ya Taifa ya Tri-Service huko Taiwan; Hospitali ya Chuo Kikuu cha Kyungpook nchini Korea Kusini; Shule ya Matibabu, Chuo Kikuu cha Chulalongkorn nchini Thailand; Diagnosticos da America SA nchini Brazil; Chuo Kikuu cha California, San Francisco; VA San Diego; Chuo Kikuu cha Toronto; Taasisi za Taifa za Afya huko Bethesda, Maryland; , , Takwimu kutoka maeneo matatu ya kujitegemea zimetumika kwa ajili ya utekelezaji wa kujitegemea: CDH, MVH na NCH, wote katika Massachusetts, Marekani. Hospitali hizi tatu zilikuwa na sifa za idadi ya wagonjwa tofauti na maeneo ya mafunzo. Takwimu zilizotumika kwa utekelezaji wa algorithm zilikuwa na wagonjwa waliohudhuria ED katika maeneo haya kati ya Machi 2020 na Februari 2021, na walipokubaliana na vigezo sawa vya uingiliaji na data zilizotumika kwa mafunzo ya mfano wa FL. 1a ya 61 62 63 Mkusanyiko wa data Tovuti za wateja 20 ziliandaa jumla ya kesi za 16,148 (pamoja na hasi) kwa madhumuni ya mafunzo, utekelezaji na majaribio ya mfano (Kielelezo. Takwimu za matibabu zilipatikana kuhusiana na wagonjwa ambao walipokidhi vigezo vya uchunguzi. Tovuti za wateja zilifanya juhudi za kuingiza kesi zote za COVID-imara tangu mwanzo wa pandemia mnamo Desemba 2019 na hadi wakati walianza mafunzo ya ndani kwa ajili ya utafiti wa EXAM. Mafunzo yote ya ndani yalikuwa yameanza mnamo Septemba 30, 2020. Tovuti hizo pia zilihusisha wagonjwa wengine katika kipindi hicho na matokeo ya mtihani wa RT-PCR hasi. Kwa kuwa wengi wa tovuti zilikuwa na wagonjwa wengi wenye SARS-COV-2-imara kuliko wagonjwa wenye -imara, tulilazimisha idadi ya wagonjwa wasio na uhakika kuingiza hadi 95% ya jumla ya kesi katika kila tovuti ya wateja. 1B ya ‘matukio’ yalikuwa na CXR na data zinazohitajika zilizochukuliwa kutoka kwa rekodi ya matibabu ya mgonjwa. Usambazaji na mifano ya nguvu ya picha ya CXR (mawazo ya piksel) yalibadilika sana kati ya maeneo kutokana na idadi kubwa ya sababu maalum za mgonjwa na tovuti, kama vile wazalishaji tofauti wa kifaa na mikataba ya picha, kama ilivyoonyeshwa katika picha. umri wa wagonjwa na usambazaji wa kipengele cha EMR ulibadilika sana kati ya maeneo, kama ilivyotarajiwa kutokana na tofauti ya idadi ya watu kati ya hospitali zinazoshirikiwa ulimwenguni (Tafadhali Data Fig. (Kwa ajili ya 1B ya 1C ya D 6 Masharti ya uingizaji wa wagonjwa Masharti ya kuingizwa kwa wagonjwa yalikuwa: (1) mgonjwa aliyehudhuria ED ya hospitali au sawa; (2) mgonjwa alikuwa na mtihani wa RT-PCR uliofanywa wakati wowote kati ya kuwasilishwa kwa ED na kuondolewa kutoka hospitali; (3) mgonjwa alikuwa na CXR katika ED; na (4) kumbukumbu ya mgonjwa ilikuwa na angalau tano ya thamani za EMR zilizotajwa katika Tabu. Kumbuka, CXR, matokeo ya maabara na vitals kutumika walikuwa ya kwanza inapatikana kwa uchunguzi wakati wa ziara ya ED. Mfano haukujumuisha CXR yoyote, matokeo ya maabara au vitals zilizopatikana baada ya kuondoka ED. 1 Mfano wa Input Jumla ya vipengele vya 21 vya EMR vilitumiwa kama vipengele vya msingi kwa mfano. alama za matokeo (yaani, ukweli wa ardhi) ziliwekwa kulingana na mahitaji ya wagonjwa baada ya muda wa masaa 24 na 72 kutoka kwa upatikanaji wa awali kwa ED. Orodha ya kina ya vipengele na matokeo ya EMR yanayohitajika inaweza kuonekana katika Tabu . 1 Usambazaji wa usindikaji wa oksijeni kwa kutumia vifaa tofauti kwenye maeneo tofauti ya wateja unaonyeshwa katika Aina ya Data ya Kuongezeka. , ambayo inafafanua matumizi ya kifaa wakati wa kuingia kwenye ED na baada ya kipindi cha 24 na 72h. Tofauti katika usambazaji wa dataset kati ya maeneo makubwa na madogo ya mteja yanaweza kuonekana katika sura ya Data ya Extended. . 7 8 Idadi ya kesi za COVID-19 chanya, kama ilivyothibitishwa na mtihani mmoja wa RT-PCR uliopatikana wakati wowote kati ya kuwasilishwa kwa ED na kuondolewa kutoka hospitalini, imeorodheshwa katika Mchoro wa ziada Kila tovuti ya mteja ilipaswa kugawana kwa random data yake katika sehemu tatu: 70% kwa ajili ya mafunzo, 10% kwa ajili ya kuthibitisha na 20% kwa ajili ya majaribio. 1 Mtihani wa Maendeleo ya Mfano Kuna tofauti kubwa katika kozi ya kliniki ya wagonjwa ambao huwasilishwa hospitalini na dalili za COVID-19, na wengine wana uzoefu wa kuharibu kwa haraka kazi ya kupumua ambayo inahitaji hatua tofauti ili kuzuia au kupunguza hypoxemia. , Uamuzi muhimu uliofanywa wakati wa tathmini ya mgonjwa katika hatua ya awali ya matibabu, au katika ED, ni kama mgonjwa anaweza kuhitaji hatua zaidi za kupinga au ufumbuzi wa rasilimali (kama vile MV au protini za monoclonal), na kwa hiyo anapaswa kupokea matibabu madogo lakini yenye ufanisi, matibabu na kiwango cha chini cha hatari na faida kutokana na madhara au kiwango cha juu cha huduma, kama vile kuingia katika kituo cha matibabu ya dharura. Kwa upande mwingine, mgonjwa ambaye ana hatari ndogo ya kuhitaji matibabu ya oksijeni inaweza kuwekwa katika mazingira ya matibabu ya chini kama vile chumba cha kawaida, au hata kutolewa kutoka ED kwa kufuatilia tena nyumbani. EXAM ilianzishwa ili kusaidia kupima wagonjwa kama hao. 62 63 64 65 Kumbuka, mfano haukubaliwa na shirika lolote la kudhibiti kwa wakati huu na unapaswa kutumika tu kwa madhumuni ya utafiti. Mtihani wa Score EXAM ilifundishwa kwa kutumia FL; inatoa alama ya hatari (ambayo huitwa alama ya EXAM) sawa na CORISK (Uchapishaji wa Takwimu ya Ufafanuzi. Ni sawa na mahitaji ya msaada wa oksijeni ya mgonjwa ndani ya dirisha mbili - 24 na 72 h - baada ya maonyesho ya awali kwa ED. inaonyesha jinsi CORISK na alama ya EXAM inaweza kutumika kwa ajili ya uchambuzi wa wagonjwa. 27 9a ya 9B ya Picha za X-ray ya chuma zilifanywa kabla ya kuchagua picha ya nafasi ya mbele na kuondoa picha za mtazamo wa upande, na kisha ziliwekwa kwa ufumbuzi wa 224 × 224. , mfano unajumuisha habari kutoka kwa vipengele vya EMR na CXR (kulingana na ResNet34 iliyobadilishwa na tahadhari ya nafasi imewasilishwa kwenye Dataset ya CheXpert) Mtandao wa Deep & Cross Ili kuunganisha aina hizi tofauti za data, vektor 512-dimensional ya kipengele kilichopatikana kutoka kwa kila picha ya CXR kwa kutumia ResNet34 iliyopangwa, na tahadhari ya nafasi, kisha iliyounganishwa na vipengele vya EMR kama ufungaji kwa mtandao wa Deep & Cross. Matokeo ya mwisho yalikuwa thamani ya kuendelea katika kiwango cha 0-1 kwa utabiri wote wa 24- na 72-h, kulingana na alama zilizotajwa hapo juu, kama ilivyoonyeshwa katika Kielelezo cha Data ya Kuongezeka. Tulitumia cross-entropy kama kazi ya kupoteza na ‘Adam’ kama optimizer. Jinsi ya kutumia NVIDIA Clara Train SDK AUC ya wastani kwa kazi za kielelezo (≥LFO, ≥HFO/NIV au ≥MV) ilipangwa na kutumika kama kiwango cha mwisho cha tathmini, na normalization kwa wastani wa nusu na variance ya kipengele. picha za CXR zilichaguliwa kabla ya kuchagua mfululizo sahihi na kuondoa picha za mtazamo wa upande, kisha zilisimamiwa kwa ufumbuzi wa 224 × 224 (ref. (Kwa ajili ya 9a ya 66 67 68 9B ya 69 70 27 Utambulisho wa utambulisho na normalization Mfano wa algorithm Ilikuwa kutumika kuchanganya vipengele vya EMR, kulingana na seti ya data ya mafunzo ya ndani. Ikiwa kipengele cha EMR kilikuwa kimepoteza kabisa kutoka kwa seti ya data ya tovuti ya mteja, thamani ya wastani ya kipengele hicho, ilipangwa tu kutoka kwa data kutoka kwa maeneo ya mteja ya MGB, ilitumiwa. 71 Maelezo ya kuunganisha data ya EMR-CXR kwa kutumia mtandao wa Deep & Cross Ili kubuni mwingiliano wa vipengele kutoka kwa data ya EMR na CXR katika ngazi ya kesi, mfumo wa kipengele cha kina ulitumika kulingana na usanifu wa mtandao wa Deep & Cross. Vipengele vya binary na vya kikomo kwa vipengele vya EMR, pamoja na vipengele vya picha vya 512-dimensional katika CXR, vilibadilishwa katika vektor ya jumla ya thamani halisi kwa kuingiza na kuingiza ngazi. Vektor ya jumla ya kubadilishwa ilitumika kama kipengele cha kuingiza, ambayo hasa ilitumia mtandao wa kuingiza ili kuzuia kuingiza kati ya vipengele kutoka vyanzo tofauti. Mtandao wa kuingiza ulifanya uingiliaji wa kipengele wazi ndani ya ngazi zake, kwa kuendesha bidhaa za ndani kati ya kipengele cha awali cha kuingiza na output kutoka ngazi ya awali, hivyo kuongeza kiwango cha ushirikiano kati ya vipengele. Wakati huo huo huo, mitandao mawili ya neural ya kina na ngazi kadhaa ziliz 68 FL details Labda aina ya FL iliyoanzishwa zaidi ni utekelezaji wa algorithm ya wastani wa shirikisho kama ilivyopendekezwa na McMahan et al. , au tofauti zake. algorithm hii inaweza kufanywa kwa kutumia utekelezaji wa mteja-server ambapo kila tovuti inayoshiriki inafanya kazi kama mteja. Mtu anaweza kufikiria FL kama mbinu inayo lengo la kupunguza kazi ya hasara ya kimataifa kwa kupunguza seti ya kazi ya hasara ya ndani, ambayo inakadiriwa kwenye kila tovuti. Kwa kupunguza hasara ya ndani ya kila tovuti ya mteja wakati pia kulinganisha uzito wa tovuti ya mteja uliojifunza kwenye seva ya jumla ya jumla, mtu anaweza kupunguza hasara ya kimataifa bila haja ya kufikia dataset nzima katika eneo la kati. Kila tovuti ya mteja inafundisha mahali fulani, na kushiriki updates ya uzito wa mfano na seva ya kati ambayo inashirikisha mchango kwa kutumia viwango vya salama vya sockets encryption na protocols ). 72 9C ya Pseudoalgorithm ya FL inaonyeshwa katika Maelezo ya ziada Katika majaribio yetu, tumeweka idadi ya mikutano ya shirikisho katika = 200, na kipindi kimoja cha mafunzo ya ndani kwa mzunguko kwa kila mteja. idadi ya wateja, , ilikuwa hadi 20 kulingana na uhusiano wa mtandao wa wateja au data inapatikana kwa kipindi cha matokeo maalum (24 au 72 h). idadi ya iterations ya mafunzo ya ndani, , inategemea ukubwa wa dataset kwa kila mteja na hutumiwa kupima mchango wa kila mteja wakati wa kuunganisha uzito wa mfano kwa wastani wa shirikisho. Wakati wa kazi ya mafunzo ya FL, kila tovuti ya mteja inachagua mfano wake bora wa ndani kwa kufuatilia utendaji wa mfano kwenye seti yake ya uhakiki wa ndani. Wakati huo huo huo, seva huamua mfano bora wa kimataifa kulingana na takwimu za wastani za uhakiki zilizotumwa kutoka kila tovuti ya mteja kwa seva baada ya kila mzunguko wa FL. Baada ya mafunzo ya FL kumalizika, mifano bora ya ndani na mifano bora ya kimataifa yanachaguliwa moja kwa moja na tovuti zote za mteja na kutathminiwa juu ya data zao za mtihani wa ndani. 1 T t K ya nk k Wakati wa mafunzo juu ya data za mitaa tu (mstari wa msingi), tumeweka idadi ya epoch kwa 200. Optimizer Adam ilitumiwa kwa mafunzo ya mitaa na FL na kiwango cha awali cha kujifunza cha 5 × 10-5 na kiwango cha kujifunza cha hatua kwa hatua cha 0.5 baada ya kila 40 epoches, ambayo ni muhimu kwa kuunganisha wastani wa federated Mabadiliko ya affine ya random, ikiwa ni pamoja na rotation, tafsiri, kupiga, kupanua na ghasia na mabadiliko ya kasi ya random, yalitumika kwenye picha kwa ajili ya kuongeza data wakati wa mafunzo. 73 Kutokana na hisia ya vichaka vya BN wakati wa kushughulikia wateja tofauti katika mazingira yasiyo ya kujitegemea na yaliyotengwa sawa, tuligundua utendaji bora wa mfano ulifanyika wakati wa kuweka ResNet34 iliyopangwa kwa lengo la nafasi. viwango vya kudhibitiwa wakati wa mafunzo ya FL (yaani, kwa kutumia kiwango cha kujifunza cha zero kwa ngazi hizo). Mtandao wa Deep & Cross ambao unachanganya vipengele vya picha na vipengele vya EMR hauna ngazi za BN na kwa hiyo haukuathiriwa na matatizo ya utulivu wa BN. 58 47 Katika utafiti huu tulijaribu mfumo wa uhifadhi wa faragha ambao unashiriki tu updates sehemu ya mfano kati ya seva na maeneo ya wateja. Updates za uzito zilichaguliwa wakati wa kila iteration kwa ukubwa wa mchango, na tu asilimia fulani ya updates kubwa ya uzito ilichaguliwa na seva. Kwa usahihi, updates za uzito (ambayo pia inajulikana kama gradients) zilichaguliwa tu ikiwa thamani yao ya kimsingi ilikuwa juu ya kiwango fulani cha asilimia, (a) Ufafanuzi wa data ya kiwango cha juu. ), ambayo ilipangwa kutoka kwa gradient yote yasiyo ya zero, Δ , na inaweza kuwa tofauti kwa kila mteja Katika kila mzunguko wa Mabadiliko ya mpango huu yanaweza kuhusisha kupiga marufuku ya gradients kubwa au mipango tofauti ya faragha. ambayo huongeza ghasia ya random kwa gradients, au hata kwa data nyekundu, kabla ya kuingiza kwenye mtandao . k 5 Mifano ya T (T) k t 49 51 Uchambuzi wa Takwimu Tumefanya mtihani wa alama ya Wilcoxon ili kuthibitisha umuhimu wa kuboresha utendaji uliotazamiwa kati ya mfano wa mafunzo ya ndani na mfano wa FL kwa pointi za 24 na 72 za saa (Kielelezo. na data ya kuendeleza. (Hipoteza ya null ilikataa kwa upande mmoja. 1 × 10–3 katika kesi zote mbili. 2 1 P Utafiti wa Pearson ulifanywa ili kutathmini umuhimu wa kuimarisha (ukubwa wa thamani ya AUC ya wastani kwa data za mtihani wa tovuti nyingine za wateja) ya mifano ya mafunzo ya ndani kuhusiana na ukubwa wa dataset ya ndani. Kwa maana ya 0.43 = 0.035, kiwango cha uhuru (df) = 17 kwa mfano wa saa 24 na kwa ajili ya 0.62 = 0.003, df = 16 kwa mfano wa 72-h). Hii inaonyesha kwamba ukubwa wa dataset pekee sio sababu pekee ya kuamua ujasiri wa mfano kwa data isiyoonekana. r P r P Kwa kulinganisha curves ya ROC kutoka kwa mfano wa FL wa kimataifa na mifano ya ndani iliyohitimu katika maeneo tofauti (Extended Data Fig. ), tulizindua sampuli 1,000 kutoka kwa data na kuhesabu AUC zilizotokana. = (AUC1 – AUC2) kwa ajili ya , where Hii ni tofauti ya kawaida, ni tofauti ya kawaida ya tofauti ya bootstrap na AUC1 na AUC2 ni mfululizo wa AUC wa bootstrapped. kwa usambazaji wa kawaida, tulipata viwango vilivyoonyeshwa katika Meza ya ziada Matokeo yanaonyesha kwamba hypothesis ya null ilikataa kwa kiwango cha chini sana. Mstari wa chini: Roho inawakilisha thamani nzuri. viwango vilifanywa katika R na maktaba ya pROC . 3 D s D s D P 2 P P 74 Kwa kuwa mfano unatarajia matokeo ya kipekee, kiwango cha kuendelea kutoka 0 hadi 1, tathmini ya kalibration ya moja kwa moja kama vile qqplot haiwezekani. Tumefanya mtihani wa kipimo cha moja kwa moja (ANOVA) kulinganisha alama za mfano wa ndani na FL kati ya makundi manne ya ukweli wa ardhi (RA, LFO, HFO, MV). takwimu, iliyolipwa kama tofauti kati ya sampuli inamaanisha kushiriki na tofauti ndani ya sampuli na kuwakilisha kiwango cha usambazaji kati ya vikundi tofauti, ili kutumika kwa kiasi cha mifano. matokeo yetu yanaonyesha kwamba -maana ya maeneo mitano tofauti ya ndani ni 245.7, 253.4, 342.3, 389.8 na 634.8, wakati wa mfano wa FL ni 843.5. -maadili inamaanisha kwamba makundi ni tofauti zaidi, pointi kutoka kwa mfano wetu wa FL zinaonyesha wazi zaidi usambazaji kati ya makundi manne ya ukweli wa msingi. thamani ya mtihani wa ANOVA kwenye mfano wa FL ni <2 × 10-16, ambayo inaonyesha kuwa alama za utabiri wa FL ni tofauti sana kati ya darasa tofauti za utabiri. 10 F F F P Ripoti ya muhtasari Maelezo zaidi juu ya mpango wa utafiti inapatikana katika imeunganishwa na makala hii. Ripoti ya utafiti wa asili Upatikanaji wa data Takwimu hizi zilitumiwa kwa mafunzo katika kila moja ya maeneo ya ndani na hazijashirikiwa na taasisi nyingine yoyote iliyoshirikiana au na seva ya shirikisho, na hazipatikani kwa umma. Takwimu kutoka kwenye maeneo ya uhakiki wa kujitegemea zinahifadhiwa na CAMCA, na upatikanaji unaweza kuomba kwa kuwasiliana na Q.L. Kulingana na uamuzi wa CAMCA, uchunguzi wa kushiriki data na marekebisho ya IRB kwa madhumuni ya utafiti yanaweza kufanywa na utafiti wa utafiti wa MGB na kulingana na IRB na sera za MGB. Kodi ya upatikanaji Msimbo na programu zote zilizotumika katika utafiti huu zinaweza kupatikana kwa umma katika NGC. Ili kufikia, kuingia kama mgeni au kuunda profile, chagua mojawapo ya URL zifuatazo. Mipango ya mafunzo, miongozo ya kuandaa data, msimbo wa mafunzo, uchunguzi wa uthibitisho wa mfano, faili ya readme, miongozo ya ufungaji na faili za leseni zinaweza kupatikana kwa umma katika NVIDIA NGC : ya Programu ya kujifunza ya federated inapatikana kama sehemu ya Clara Train SDK: Kama mbadala, kutumia amri hii kupakua mfano wa "wget --content-disposition -O clara_train_covid19_exam_ehr_xray_1.zip”. 61 https://ngc.nvidia.com/catalog/models/nvidia:med:clara_train_covid19_exam_ehr_xray https://ngc.nvidia.com/catalog/containers/nvidia:clara-train-sdk https://api.ngc.nvidia.com/v2/models/nvidia/med/clara_train_covid19_exam_ehr_xray/versions/1/zip Maelezo ya Budd, J. et al. Digital technologies in the public-health response to COVID-19. , 1183–1192 (2020). Nat. Med. 26 Moorthy, V., Henao Restrepo, A. M., Preziosi, M.-P. & Swaminathan, S. Data sharing for novel coronavirus (COVID-19). , 150 (2020). Bull. World Health Organ. 98 Chen, Q., Allot, A. & Lu, Z. Keep up with the latest coronavirus research. , 193 (2020). Nature 579 Fabbri, F., Bhatia, A., Mayer, A., Schlotter, B. & Kaiser, J. BCG IT spend pulse: how COVID-19 is shifting tech priorities. (2020). https://www.bcg.com/publications/2020/how-covid-19-is-shifting-big-it-spend Candelon, F., Reichert, T., Duranton, S., di Carlo, R. C. & De Bondt, M. The rise of the AI-powered company in the postcrisis world. (2020). https://www.bcg.com/en-gb/publications/2020/business-applications-artificial-intelligence-post-covid Chao, H. et al. Integrative analysis for COVID-19 patient outcome prediction. , 101844 (2021). Med. Image Anal. 67 Zhu, X. et al. Joint prediction and time estimation of COVID-19 developing severe symptoms using chest CT scan. , 101824 (2021). Med. Image Anal. 67 Yang, D. et al. Federated semi-supervised learning for Covid region segmentation in chest ct using multi-national data from China, Italy, Japan. , 101992 (2021). Med. Image Anal. 70 Minaee, S., Kafieh, R., Sonka, M., Yazdani, S. & Jamalipour Soufi, G. Deep-COVID: predicting COVID-19 from chest X-ray images using deep transfer learning. , 101794 (2020). Med. Image Anal. 65 COVID-19 Studies from the World Health Organization Database. (2020). https://clinicaltrials.gov/ct2/who_table ACTIV. (2020). https://www.nih.gov/research-training/medical-research-initiatives/activ Coronavirus Treatment Acceleration Program (CTAP). US Food and Drug Administration (2020). https://www.fda.gov/drugs/coronavirus-covid-19-drugs/coronavirus-treatment-acceleration-program-ctap Gleeson, P., Davison, A. P., Silver, R. A. & Ascoli, G. A. A commitment to open source in neuroscience. , 964–965 (2017). Neuron 96 Piwowar, H. et al. The state of OA: a large-scale analysis of the prevalence and impact of open access articles. , e4375 (2018). PeerJ. 6 European Society of Radiology (ESR). What the radiologist should know about artificial intelligence – an ESR white paper. , 44 (2019). Insights Imaging 10 Pesapane, F., Codari, M. & Sardanelli, F. Artificial intelligence in medical imaging: threat or opportunity? Radiologists again at the forefront of innovation in medicine. , 35 (2018). Eur. Radiol. Exp. 2 Price, W. N. 2nd & Cohen, I. G. Privacy in the age of medical big data. , 37–43 (2019). Nat. Med. 25 Liang, W. et al. Development and validation of a clinical risk score to predict the occurrence of critical illness in hospitalized patients with COVID-19. , 1081–1089 (2020). JAMA Intern. Med. 180 Wynants, L. et al. Prediction models for diagnosis and prognosis of covid-19 infection: systematic review and critical appraisal. , m1328 (2020). Brit. Med. J. 369 Zhang, L. et al. D-dimer levels on admission to predict in-hospital mortality in patients with Covid-19. , 1324–1329 (2020). J. Thromb. Haemost. 18 Sands, K. E. et al. Patient characteristics and admitting vital signs associated with coronavirus disease 2019 (COVID-19)-related mortality among patients admitted with noncritical illness. (2020). https://doi.org/10.1017/ice.2020.461 American College of Radiology. CR recommendations for the use of chest radiography and computed tomography (CT) for suspected COVID-19 infection. (2020). https://www.acr.org/Advocacy-and-Economics/ACR-Position-Statements/Recommendations-for-Chest-Radiography-and-CT-for-Suspected-COVID19-Infection Rubin, G. D. et al. The role of chest imaging in patient management during the COVID-19 pandemic: a multinational consensus statement from the Fleischner Society. , 172–180 (2020). Radiology 296 World Health Organization. Use of chest imaging in COVID-19. (2020). https://www.who.int/publications/i/item/use-of-chest-imaging-in-covid-19 Jamil, S. et al. Diagnosis and management of COVID-19 disease. , 10 (2020). Am. J. Respir. Crit. Care Med. 201 Redmond, C. E., Nicolaou, S., Berger, F. H., Sheikh, A. M. & Patlas, M. N. Emergency radiology during the COVID-19 pandemic: The Canadian Association of Radiologists Recommendations for Practice. , 425–430 (2020). Can. Assoc. Radiologists J. 71 Buch, V. et al. Development and validation of a deep learning model for prediction of severe outcomes in suspected COVID-19 Infection. Preprint at (2021). https://arxiv.org/abs/2103.11269 Lyons, C. & Callaghan, M. The use of high-flow nasal oxygen in COVID-19. , 843–847 (2020). Anaesthesia 75 Whittle, J. S., Pavlov, I., Sacchetti, A. D., Atwood, C. & Rosenberg, M. S. Respiratory support for adult patients with COVID-19. , 95–101 (2020). J. Am. Coll. Emerg. Physicians Open 1 Ai, J., Li, Y., Zhou, X. & Zhang, W. COVID-19: treating and managing severe cases. , 370–371 (2020). Cell Res. 30 Esteva, A. et al. A guide to deep learning in healthcare. , 24–29 (2019). Nat. Med. 25 Cahan, E. M., Hernandez-Boussard, T., Thadaney-Israni, S. & Rubin, D. L. Putting the data before the algorithm in big data addressing personalized healthcare. , 78 (2019). NPJ Digit. Med. 2 Thrall, J. H. et al. Artificial intelligence and machine learning in radiology: opportunities, challenges, pitfalls, and criteria for success. , 504–508 (2018). J. Am. Coll. Radiol. 15 Shilo, S., Rossman, H. & Segal, E. Axes of a revolution: challenges and promises of big data in healthcare. , 29–38 (2020). Nat. Med. 26 Gao, Y. & Cui, Y. Deep transfer learning for reducing health care disparities arising from biomedical data inequality. , 5131 (2020). Nat. Commun. 11 Rieke, N. et al. The future of digital health with federated learning. , 119 (2020). NPJ Dig. Med. 3 Yang, Q., Liu, Y., Chen, T. & Tong, Y. Federated machine learning: concept and applications. , 12 (2019). ACM Trans. Intell. Syst. Technol. 10 Ma, C. et al. On safeguarding privacy and security in the framework of federated learning. , 242–248 (2020). IEEE Netw. 34 Brisimi, T. S. et al. Federated learning of predictive models from federated Electronic Health Records. , 59–67 (2018). Int. J. Med. Inform. 112 Roth, H. R. et al. Federated learning for breast density classification: a real-world implementation. In , (eds. Albarqouni, S. et al.) Vol. 12,444, 181–191 (Springer International Publishing, 2020). Proc. Second MICCAI Workshop, DART 2020 and First MICCAI Workshop, DCL 2020 Domain Adaptation and Representation Transfer, and Distributed and Collaborative Learning Sheller, M. J. et al. Federated learning in medicine: facilitating multi-institutional collaborations without sharing patient data. , 12598 (2020). Sci. Rep. 10 Remedios, S. W., Butman, J. A., Landman, B. A. & Pham, D. L. in (eds Remedios, S. W. et al.) (Springer, 2020). Federated Gradient Averaging for Multi-Site Training with Momentum-Based Optimizers Xu, Y. et al. A collaborative online AI engine for CT-based COVID-19 diagnosis. Preprint at (2020). https://www.medrxiv.org/content/10.1101/2020.05.10.20096073v2 Raisaro, J. L. et al. SCOR: A secure international informatics infrastructure to investigate COVID-19. , 1721–1726 (2020). J. Am. Med. Inform. Assoc. 27 Vaid, A. et al. Federated learning of electronic health records to improve mortality prediction in hospitalized patients with COVID-19: machine learning approach. , e24207 (2021). JMIR Med. Inform. 9 Nino, G. et al. Pediatric lung imaging features of COVID-19: a systematic review and meta-analysis. , 252–263 (2021). Pediatr. Pulmonol. 56 Fredrikson, M., Jha, S. & Ristenpart, T. Model inversion attacks that exploit confidence information and basic countermeasures. In 1322–1333, (2015). Proc. 22nd ACM SIGSAC Conference on Computer and Communications Security https://doi.org/10.1145/2810103.2813677 Zhu, L., Liu, Z. & Han, S. in (eds Wallach, H. et al.) 14774–14784 (Curran Associates, Inc., 2019). Advances in Neural Information Processing Systems 32 Kaissis, G. A., Makowski, M. R., Rückert, D. & Braren, R. F. Secure, privacy-preserving and federated machine learning in medical imaging. , 305–311 (2020). Nat. Mach. Intell. 2 Li, W. et al. in 133–141 (Springer, 2019). Privacy-Preserving Federated Brain Tumour Segmentation Shokri, R. & Shmatikov, V. Privacy-preserving deep learning. In (2015). Proc. 53rd Annual Allerton Conference on Communication, Control, and Computing (Allerton) https://doi.org/10.1109/allerton.2015.7447103 Li, X. et al. Multi-site fMRI analysis using privacy-preserving federated learning and domain adaptation: ABIDE results. , 101765 (2020). Med. Image Anal. 65 Estiri, H. et al. Predicting COVID-19 mortality with electronic medical records. , 15 (2021). NPJ Dig. Med. 4 Jiang, G. et al. Harmonization of detailed clinical models with clinical study data standards. , 65–74 (2015). Methods Inf. Med. 54 Yang, D. et al. in . (2019). Searching Learning Strategy with Reinforcement Learning for 3D Medical Image Segmentation https://doi.org/10.1007/978-3-030-32245-8_1 Elsken, T., Metzen, J. H. & Hutter, F. Neural architecture search: a survey. , 1–21 (2019). J. Mach. Learning Res. 20 Yao, Q. et al. Taking human out of learning applications: a survey on automated machine learning. Preprint at (2019). https://arxiv.org/abs/1810.13306 Ioffe, S. & Szegedy, C. Batch normalization: accelerating deep network training by reducing internal covariate shift. In , PMLR , 448–456 (2015). Proc. 32nd International Conf. Machine Learning 37 Kaufman, S., Rosset, S. & Perlich, C. Leakage in data mining: formulation, detection, and avoidance. In , 556–563 (2011). Proc. 17th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining Zhang, C. et al. BatchCrypt: efficient homomorphic encryption for cross-silo federated learning. In , 493–506 (2020). Proc. 2020 USENIX Annual Technical Conference, ATC 2020 . (2020). Nvidia NGC Catalog: COVID-19 Related Models https://ngc.nvidia.com/catalog/models?orderBy=scoreDESC&pageNumber=0&query=covid&quickFilter=models&filters Marini, J. J. & Gattinoni, L. Management of COVID-19 respiratory distress. , 2329–2330 (2020). JAMA 323 Cook, T. M. et al. Consensus guidelines for managing the airway in patients with COVID-19: Guidelines from the Difficult Airway Society, the Association of Anaesthetists the Intensive Care Society, the Faculty of Intensive Care Medicine and the Royal College of Anaesthetist. , 785–799 (2020). Anaesthesia 75 Galloway, J. B. et al. A clinical risk score to identify patients with COVID-19 at high risk of critical care admission or death: an observational cohort study. , 282–288 (2020). J. Infect. 81 Kilaru, A. S. et al. Return hospital admissions among 1419 COVID-19 patients discharged from five U.S. emergency departments. , 1039–1042 (2020). Acad. Emerg. Med. 27 He, K., Zhang, X., Ren, S. & Sun, J. Deep residual learning for image recognition. In (2016). Proc. 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR) https://doi.org/10.1109/cvpr.2016.90 Irvin, J. et al. CheXpert: a large chest radiograph dataset with uncertainty labels and expert comparison. , 590–597 (2019). Proc. AAAI Conf. Artif. Intell. 33 Wang, R., Fu, B., Fu, G. & Wang, M. Deep & Cross network for Ad Click predictions. In Article no. 12 (2017). Proc. ADKDD’17 Abadi, M. et al. TensorFlow: asystem for large-scale machine learning. In , USENIX Association 265–283 (2016). 12th USENIX Symposium on Operating Systems Design and Implementation (OSDI 16) . (2020). NVIDIA Clara Imaging https://developer.nvidia.com/clara-medical-imaging Stekhoven, D. J. & Bühlmann, P. MissForest–non-parametric missing value imputation for mixed-type data. , 112–118 (2012). Bioinformatics 28 McMahan, H., Moore, E., Ramage, D., Hampson, S. & y Arcas, B. A. Communication-efficient learning of deep networks from decentralized data. (2017). http://proceedings.mlr.press/v54/mcmahan17a.html Hsieh, K., Phanishayee, A., Mutlu, O. & Gibbons, P. B. The non-IID data quagmire of decentralized machine learning. In PMLR 119 (2020). Proc. 37th International Conf. Machine Learning Robin, X. et al. pROC: an open-source package for R and S+ to analyze and compare ROC curves. , 77 (2011). BMC Bioinformatics 12 Ujumbe wa Maoni yaliyotolewa katika utafiti huu ni ya waandishi na sio lazima ya NHS, NIHR, Idara ya Afya na Huduma ya Jamii au yoyote ya mashirika yanayohusiana na wamiliki. MGB anashukuru watu wafuatao kwa msaada wao: J. Brink, Idara ya Radiolojia, Massachusetts General Hospital, Harvard Medical School, Boston, MA; M. Kalra, Idara ya Radiolojia, Massachusetts General Hospital, Harvard Medical School, Boston, MA; N. Neumark, Kituo cha Sayansi ya Data Clinical, Massachusetts General Brigham, Boston, MA; T. Schultz, Idara ya Radiolojia, Massachusetts General Hospital, Boston, MA; N. Guo, Kituo cha Radiolojia ya Matibabu ya Juu na Uchambuzi, Idara ya Radiolojia, kupitia Chuo Kikuu cha Matibabu, Chulalongkorn Chuo Kikuu cha Shukrani Ratchadapisek Sompoch Endowment Fund RA (PO) (No. 001/63) kwa ukusanyaji na usimamizi wa data za kliniki na sampuli za kibaiolojia zinazohusiana na COVID-19 kwa Task Force Utafiti, Chuo Kikuu cha Matibabu, Chulalongkorn Chuo Kikuu. NIHR Cambridge Biomedical Research Center shukrani A. Priest, ambaye ni msaada wa NIHR (Cambridge Biomedical Research Centre katika Chuo Kikuu cha Hospitali NHS Foundation Trust). National Taiwan University MeDA Lab na MAHC na Taiwan National Health Insurance Administration shukrani MOST Joint Research Center kwa Teknolojia ya AI, All Vista Healthcare National Health Insurance Administration, Taiwan, Wizara ya Sayan https://data.ucsf.edu/covid19 Makala hii inapatikana katika asili chini ya leseni ya CC by 4.0 Deed (Attribution 4.0 International). Makala hii ni chini ya leseni ya CC by 4.0 Deed (Attribution 4.0 International). Inapatikana kwa asili