Новият първи AI предсказва сериозността на COVID с помощта на рентгенови лъчи и медицински записи

на авторите: Ittai Dayan Holger R. Roth Aoxiao Zhong Ahmed Harouni Amilcare Gentili Anas Z. Abidin Andrew Liu Anthony Beardsworth Costa Bradford J. Wood Chien-Sung Tsai Chih-Hung Wang Chun-Nan Hsu К. К. Лий Peiying Ruan Daguang Xu Dufan Wu Eddie Huang Felipe Campos Kitamura Griffin Lacey Gustavo César de Antônio Corradi Gustavo Nino Hao-Hsin Shin Hirofumi Obinata Hui Ren Jason C. Crane Jesse Tetreault Jiahui Guan John W. Garrett Joshua D. Kaggie Jung Gil Park Keith Dreyer Krishna Juluru Kristopher Kersten Marcio Aloisio Bezerra Cavalcanti Rockenbach Marius George Linguraru Masoom A. Haider Meena AbdelMaseeh Nicola Rieke Pablo F. Damasceno Pedro Mario Cruz e Silva Pochuan Wang Sheng Xu Shuichi Kawano Sira Sriswasdi Soo Young Park Thomas M. Grist Varun Buch Watsamon Jantarabenjakul Weichung Wang Won Young Tak Xiang Li Xihong Lin Young Joon Kwon Abood Quraini Andrew Feng Andrew N. Priest Baris Turkbey Benjamin Glicksberg Bernardo Bizzo Byung Seok Kim Carlos Tor-Díez Chia-Cheng Lee Chia-Jung Hsu Chin Lin Chiu-Ling Lai Christopher P. Hess Colin Compas Deepeksha Bhatia Eric K. Oermann Evan Leibovitz Hisashi Sasaki Hitoshi Mori Isaac Yang Jae Ho Sohn Krishna Nand Keshava Murthy Li-Chen Fu Matheus Ribeiro Furtado de Mendonça Mike Fralick Min Kyu Kang Mohammad Adil Natalie Gangai Peerapon Vateekul Pierre Elnajjar Sarah Hickman Sharmila Majumdar Shelley L. McLeod Sheridan Reed Stefan Gräf Stephanie Harmon Tatsuya Kodama Thanyawee Puthanakit Tony Mazzulli Vitor Lima de Lavor Yothin Rakvongthai Yu Rim Lee Yuhong Wen Fiona J. Gilbert Mona G. Flores Quanzheng Li на авторите: Ита Даян Холгер Р. Рот Аоксиао Жонг Ахмед Харуни Добрич Добрич Анас З. Абидин Андрю Лиу Антъни Беардсуърт Коста Брадфорд Джей Ууд Чиен-сунг Цай Чих-Хун Уанг Чун Нан Хсу К. К. Лий Пъзел Руан Дагуан Су Дъфън Ву Еди Хуан Фелипе Кампъс Китамура Грифин Лейси Густав Цезар от Антонио Корради Густав Нино Хао-Хсин Шин Хирофуми Obinata Хуй Рен Джейсън К. Крейн Джеси Тетройт Джиахуи Гуан Джон У. Гарет Джошуа Д. Каги Юнг Гил Парк Кийт Дрейър Кришна Юру Кристофър Керстен Марсио Алоисио Безерра Кавалканти Рокенбах Мариус Джордж Лингурару Масоом А. Хайдер Елена Абделмасее Никола Рики Пабло Ф. Дамаскино Педро Марио Круз и Силва Пъзел Wang Шън Шу Шуичи Кавано Сира Гришова Юношески парк Томас М. Грист Върна книга Дядо Коледа Външен Уанг Младежът така Ксиан Ли Xihong Lin Young Joon Kwon Къща Къща Къща Андрю Фън Андрю Н. Прист Барис Турбей Бенджамин Гликсберг Бернардо Бизо Искам да видя Ким Карлос Тор-Диес Чиа Ченг Лий Чиа-Юнг Хсу Чин Лин Чиу-линг лай Кристофър П. Хес Колин Компас Дъблин Бхатия Ерик К. Оерман Еван Лейбовиц Хисаши Сасаки Хитоши Мори Исак Ян Джей Хо Син Кришна Нанд Кешава Мъри Ли-Чен Фу Матей Рибейро Фуртадо де Мендонса Майк Фралик Мини Киу Канг Мохамед Адел Натали Гангаи Пъзел Vateekul Пиер Елнайяр Сара Хикман Sharmila Majumdar Шели Л. Маклейд Шеридан Рийд Стефан Граф Стефани Хармон Тацуя Кодама Късметлия Путинов Тони Мазули Виктор Лима на труда Йотин Ракунтай Ю Рим Лий Йонг Уен Фиона Джей Гилбърт Мона Г. Флорес Където ли абстрактна Federated Learning (FL) е метод, използван за обучение на модели на изкуствен интелект с данни от множество източници, като същевременно се поддържа анонимността на данните, като по този начин се премахват много бариери пред споделянето на данни. Тук използвахме данни от 20 института по целия свят, за да обучим модел на FL, наречен EXAM (електронна медицинска документация (EMR) гръден рентгенов AI модел), който прогнозира бъдещите нужди от кислород на симптоматични пациенти с COVID-19 с помощта на входове на жизнени признаци, лабораторни данни и гръдни рентгенови лъчи. EXAM постигна средна площ под кривата (AUC) > 0,92 за прогнозиране на резултатите при 24 и 72 часа от момента на първоначалното представяне в спешната стая и Основен Научните, академичните, медицинските и научните общности се обединиха в лицето на пандемичната криза на COVID-19, за да оценят бързо новите парадигми в областта на изкуствения интелект (AI), които са бързи и сигурни, и потенциално да насърчат споделянето на данни и обучението и тестването на модели без обичайните бариери за неприкосновеност на личния живот и собственост на данните от конвенционалните сътрудничества. , Доставчиците на здравни услуги, изследователите и индустрията обърнаха вниманието си, за да отговорят на незадоволените и критични клинични нужди, създадени от кризата, с забележителни резултати. , , , , , , Набирането на персонал за клинични изпитвания е ускорено и улеснено от националните регулаторни органи и международния дух на сътрудничество. , , Дисциплините за анализ на данни и изкуствен интелект винаги са насърчавали отворени и съвместни подходи, като включват концепции като софтуер с отворен код, възпроизводими изследвания, хранилища на данни и предоставяне на анонимни набори от данни публично достъпни. , Пандемията подчерта необходимостта от бързо осъществяване на сътрудничество в областта на данните, което да даде възможност на клиничните и научните общности да отговорят на бързо развиващите се и широко разпространени глобални предизвикателства. , , . 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 Конкретен пример за тези видове сътрудничество е предишната ни работа по модел за подпомагане на клиничните решения (CDS) на SARS-COV-2, базиран на ИИ. Този модел на CDS е разработен в Mass General Brigham (MGB) и е валидиран в множество здравни системи. Входовете към модела на CDS са картини от рентгенови лъчи на гръдния кош (CXR), жизнени признаци, демографски данни и лабораторни стойности, които са показани в предишни публикации да предсказват резултатите от пациентите с COVID-19 , , , CXR е избран като вход за изображения, защото е широко достъпен и обикновено се посочва от насоки като тези, предоставени от ACR Дружеството Fleischner от WHO Национални гръцки общества Национално министерство на здравеопазването COVID ръководства и радиологични общества по целия свят Изходът на модела CDS е резултат, наречен CORISK , което съответства на изискванията за подпомагане на кислорода и което може да помогне при изпитването на пациенти от клиницисти от първа линия , , Известно е, че доставчиците на здравни услуги предпочитат модели, които са били валидирани по собствени данни. Към днешна дата повечето модели на изкуствения интелект, включително споменатия по-горе модел на CDS, са обучени и валидирани по „тесни“ данни, които често нямат разнообразие. , Това може да бъде смекчено чрез обучение с разнообразни данни от множество сайтове без централизиране на данните Използване на методи като трансферното обучение , или FL. FL е метод, използван за обучение на AI модели на различни източници на данни, без данните да бъдат транспортирани или изложени извън първоначалното им местоположение. . 18 19 20 21 22 23 24 25 26 27 28 29 30 27 31 32 33 34 35 36 Федерираното обучение поддържа бързото стартиране на централно оркестрирани експерименти с подобрена проследимост на данните и оценка на алгоритмичните промени и въздействия Един подход към FL, наречен клиент-сървър, изпраща "нетрениран" модел на други сървъри ("възели"), които извършват частични тренировъчни задачи, като от своя страна изпращат резултатите обратно, за да бъдат обединени в централния ("федериран") сървър. . 37 36 Управлението на данните за FL се поддържа локално, като се облекчават опасенията за поверителността, като се съобщават само тежести на моделите или градиентите между клиентски сайтове и федерирания сървър. , FL вече е показал обещание в последните приложения за медицински изображения , , , , including in COVID-19 analysis , , Забележителен пример е моделът за прогнозиране на смъртността при пациенти, заразени с SARS-COV-2, който използва клинични характеристики, макар и ограничени по отношение на броя на модалитетите и мащаба. . 38 39 40 41 42 43 8 44 45 46 Нашата цел беше да разработим мощен, обобщаващ модел, който би могъл да подпомогне изпитването на пациентите. Теоретизирахме, че моделът на CDS може да бъде успешно федерализиран, като се има предвид използването на данни, които са сравнително често срещани в клиничната практика и които не разчитат силно на оператор-зависими оценки на състоянието на пациента (като клинични впечатления или докладвани симптоми). По-скоро бяха използвани лабораторни резултати, жизнени признаци, проучване на изображенията и често улавяна демографска информация (т.е. възраст). Затова преквалифицирахме модела на CDS с разнообразни данни, използвайки подход FL на клиент-сървър, за да разработим нов глобален модел на FL, който беше наречен EXAM Нашата хипотеза беше, че EXAM ще изпълнява по-добре от местните модели и ще генерализира по-добре в здравните системи. Резултати Изпит по архитектура Моделът EXAM се основава на споменатия по-горе модел CDS. Общо 20 характеристики (19 от EMR и една от CXR) бяха използвани като вход за модела. Етикетите на резултатите (т.е. „земната истина“) бяха разпределени въз основа на терапията с кислород на пациента след 24- и 72-часови периоди от първоначалното приемане в спешното отделение (ED). Подробен списък на исканите характеристики и резултати може да се види в Таблица . 27 1 Етикетите на резултатите на пациентите са зададени на 0, 0,25, 0,50 и 0,75 в зависимост от най-интензивната кислородна терапия, която пациентът е получил в предсказателния прозорец. Категориите на кислородна терапия са съответно въздух в помещението (RA), кислород с нисък поток (LFO), кислород с висок поток (HFO)/неинвазивна вентилация (NIV) или механична вентилация (MV). Ако пациентът е починал в предсказателния прозорец, етикетът на резултата е зададен на 1. За функциите на EMR се използват само първите стойности, улавяни в ED, а предварителната обработка на данните включва деидентификация, приписване на липсваща стойност и нормализиране до нулева средна стойност и единична вариация. Моделът следователно обединява информация от функциите EMR и CXR, като използва 34-слойна конвулсивна невронна мрежа (ResNet34) за извличане на функции от CXR и Deep & Cross мрежа, за да съчетае функциите заедно с функциите EMR (за повече подробности вижте Изходът на модела е рисков резултат, наречен EXAM резултат, който е непрекъсната стойност в диапазона 0-1 за всяка от 24-часовите и 72-часовите прогнози, съответстващи на етикетите, описани по-горе. Методи Федерализиране на модела Моделът EXAM е обучен с помощта на кохорта от 16,148 случая, което го прави не само сред първите FL модели за COVID-19 но и много голям и мултиконтинентален проект за развитие в клинично релевантен ИИ (Фиг. Данните между сайтовете не са били хармонизирани преди извличането и, в светлината на реални клинични компютърни обстоятелства, подробна хармонизация на входа на данните не е проведена от авторите (Фиг. ) на 1а, б 1 С, Д , Карта на света, показваща 20 различни клиентски сайтове, които допринасят за проучването EXAM. , Брой случаи, предоставени от всяка институция или сайт (клиент 1 представлява сайта, който допринася за най-голям брой случаи). Разпределение на рентгеновия интензитет на гърдите на всеки клиент. , Възраст на пациентите на всеки клиентски сайт, показващ минималната и максималната възраст (астерики), средната възраст (триъгълници) и стандартното отклонение (хоризонтални ленти). . a b c d 1 Изследването е проведено на базата на резултатите от изследването, проведено на базата на резултатите от изследването, проведено на базата на резултатите от изследването, проведено на базата на резултатите от изследването, проведени на базата на резултатите от изследването. ( 1 × 10–3, тест на Уилкоксън с подписан рейтинг) от 16% (както е определено от средната AUC при изпълнение на модела на съответните локални тестови комплекти: от 0,795 до 0,920, или 12,5 процентни пункта) (Фиг. Той също така доведе до 38% подобрение на генерализируемостта (както е определено от средната AUC при изпълнение на модела на всички тестови комплекти: от 0,667 до 0,920, или 25,3 процентни пункта) на най-добрия глобален модел за прогнозиране на 24-часова кислородна обработка в сравнение с моделите, обучени само на собствените данни на обекта (Фиг. За прогнозните резултати от 72-часовото кислородно третиране, най-доброто глобално обучение за модели доведе до средно подобрение на производителността с 18% в сравнение с местно обучените модели, докато генерализируемостта на глобалния модел се подобри средно с 34% (Extended Data Fig. Стабилността на нашите резултати е валидирана чрез повтаряне на три курса на местно и FL обучение на различни рандомизирани данни. P 2а 2б 1 , Резултатите от теста на всеки клиент се определят като прогноза за 24-часова обработка на кислорода за модели, обучени само с локални данни (Local) спрямо най-добрия глобален модел, наличен на сървъра (FL). , Обобщаемост (средна производителност на тестовите данни на други сайтове, представена от средната AUC) като функция на размера на набора от данни на клиента (няма случаи). Зелената хоризонтална линия обозначава производителността на обобщаемостта на най-добрия глобален модел. ) и клиент 14 имаше случаи само с RA лечение, така че метриката за оценка (от AUC) не е приложима в нито един от тези случаи ( Данните за клиент 14 също са изключени от изчисляването на средната генерализируемост в локалните модели. a b 1 Методи Местните модели, които са обучени с помощта на небалансирани кохорти (например, най-вече леки случаи на COVID-19) значително се възползват от подхода FL, с значително подобрение в прогнозираната средна AUC ефективност за категории с само няколко случая. Това е очевидно на клиентския сайт 16 (небалансиран набор от данни), като повечето пациенти изпитват лека тежест на заболяването и само с няколко тежки случая.Моделът FL постига по-висока истинско-положителна скорост за двата положителни (тежки) случая и значително по-ниска фалшиво-положителна скорост в сравнение с локалния модел, както показани в рецептора оперативна характеристика (ROC) сюжети и матрици за объркване (фиг Разширени данни Fig. По-важното е, че генерализируемостта на модела FL е значително увеличена в сравнение с локално обучения модел. 3а 2 , ROC at client site 16, with unbalanced data and mostly mild cases. , ROC of the local model at client site 12 (a small dataset), mean ROC of models trained on larger datasets corresponding to the five client sites in the Boston area (1, 4, 5, 6, 8) and ROC of the best global model in prediction of 72-h oxygen treatment for different thresholds of EXAM score (left, middle, right). The mean ROC is calculated based on five locally trained models while the gray area denotes the ROC standard deviation. ROCs for three different cutoff values ( ) of the EXAM risk score are shown. Pos and neg denote the number of positive and negative cases, respectively, as defined by this range of EXAM score. a b t In the case of client sites with relatively small datasets, the best FL model markedly outperformed not only the local model but also those trained on larger datasets from five client sites in the Boston area of the USA (Fig. ) на 3b The global model performed well in predicting oxygen needs at 24/72 h in patients both COVID positive and negative (Extended Data Fig. ). 3 Валидиране на независими сайтове След първоначалното обучение, EXAM е тестван на три независими места за валидиране: Болница Cooley Dickinson (CDH), Болница Martha’s Vineyard (MVH) и Болница Nantucket Cottage (NCH), всички в Масачузетс, САЩ. , и кривите на ROC и матриците на объркване за най-големия набор от данни (от CDH) са показани на фигура. . The operating point was set to discriminate between nonmechanical ventilation and mechanical ventilation (MV) treatment (or death). The FL global trained model, EXAM, achieved an average AUC of 0.944 and 0.924 for 24- and 72-h prediction tasks, respectively (Table ), which exceeded the average performance among sites used in training EXAM. For prediction of MV treatment (or death) at 24 h, EXAM achieved a sensitivity of 0.950 and specificity of 0.882 at CDH, and a sensitivity of 1.000 specificity of 0.934 at MVH. NCH did not have any cases with MV/death at 24 h. In regard to 72-h MV prediction, EXAM achieved a sensitivity of 0.929 and specificity of 0.880 at CDH, sensitivity of 1.000 and specificity of 0.976 at MVH and sensitivity of 1.000 and specificity of 0.929 at NCH. 2 4 2 , , Performance (ROC) (top) and confusion matrices (bottom) of the EXAM FL model on the CDH dataset for prediction of oxygen requirement at 24 h ( ) and 72 h ( Задължително е да се изчислят три различни стойности на стойностите за рециклиране ( ) of the EXAM risk score are shown. a b a b t За MV в CDH в 72 ч, EXAM имаше нисък фалшиво-отрицателен процент от 7.1%. , showing two false-negative cases from CDH where one case had many missing EMR data features and the other had a CXR with a motion artifact and some missing EMR features. 4 Use of differential privacy Основната мотивация за здравните заведения да използват FL е да запазят сигурността и поверителността на своите данни, както и спазването на мерките за съответствие с данните. or even the reconstruction of training images from the model gradients themselves . To counter these risks, security-enhancing measures were used to mitigate risk in the event of data ‘interception’ during site-server communication . We experimented with techniques to avoid interception of FL data, and added a security feature that we believe could encourage more institutions to use FL. We thus validated previous findings showing that partial weight sharing, and other differential privacy techniques, can successfully be applied in FL Чрез разследване на схема за частично разпределение на теглото , , , показахме, че моделите могат да постигнат сравнима производителност дори когато се споделят само 25% от актуализациите на теглото (Extended Data Fig. ). 47 48 49 50 50 51 52 5 Discussion Това проучване включва голямо, реално проучване на FL в областта на здравеопазването по отношение на броя на сайтовете и броя на използваните точки за данни. Смятаме, че предоставя мощно доказателство за осъществимостта на използването на FL за бързо и съвместно разработване на необходимите модели на ИИ в здравеопазването. Нашето проучване включва множество сайтове на четири континента и под надзора на различни регулаторни органи и по този начин държи обещанието да бъде предоставено на различни регулирани пазари по ускорен начин. Глобалният модел FL, EXAM, се оказа по-силен и постигна по-добри резултати на отделни сайтове, отколкото всеки модел, обучен само на местни данни. Смятаме, че последователното подобрение е постигнато поради по-голям За клиентския сайт с сравнително малък набор от данни може да се използват два типични подхода за приспособяване на полезен модел: единият е да се обучава локално със собствените си данни, а другият е да се прилага модел, обучен върху по-голям набор от данни. За сайтовете с малки набори от данни би било практически невъзможно да се изгради ефективен модел за дълбоко обучение, използвайки само техните локални данни. Откритието, че тези два подхода са превъзхождали и трите задачи за прогнозиране от глобалния модел FL, показва, че ползата за клиентски сайтове с малки набори от данни, произтичащи от участието в FL сътрудничества, е значителна. Това вероятно е отражение на способността на FL да улавя повече разнообразие от местното обучение и да . 46 Резултатите от валидирането потвърждават, че глобалният модел е стабилен, подкрепяйки нашата хипотеза, че моделите, обучени от FL, са обобщени в здравните системи. Те предоставят убедителен случай за използването на предсказуеми алгоритми в грижата за пациентите с COVID-19 и използването на FL в създаването и тестването на модели. Чрез участието в това проучване клиентски сайтове получиха достъп до EXAM, за да бъдат допълнително валидирани преди преследването на всяко регулаторно одобрение или бъдещо въвеждане в клиничната грижа. , as well as at different sites that were not a part of the EXAM training. 53 Over 200 prediction models to support decision-making in patients with COVID-19 have been published . Unlike the majority of publications focused on diagnosis of COVID-19 or prediction of mortality, we predicted oxygen requirements that have implications for patient management. We also used cases with unknown SARS-COV-2 status, and so the model could provide input to the physician ahead of receiving a result for PCR with reverse transcription (RT–PCR), making it useful for a real-life clinical setting. The model’s imaging input is used in common practice, in contrast with models that use chest computed tomography, a nonconsensual diagnostic modality. The model’s design was constrained to objective predictors, unlike many published studies that leveraged subjective clinical impressions. The data collected reflect varied incidence rates, and thus the ‘population momentum’ we encountered is more diverse. This implies that the algorithm can be useful in populations with different incidence rates. 19 Идентификацията на пациентската кохорта и хармонизирането на данните не са нови въпроси в научните изследвания и науката за данните , but are further complicated, when using FL, given the lack of visibility on other sites’ datasets. Improvements to clinical information systems are needed to streamline data preparation, leading to better leverage of a network of sites participating in FL. This, in conjunction with hyperparameter engineering, can allow algorithms to ‘learn’ more effectively from larger data batches and adapt model parameters to a particular site for further personalization—for example, through further fine-tuning on that site . A system that would allow seamless, close-to real-time model inference and results processing would also be of benefit and would ‘close the loop’ from training to model deployment. 54 39 Тъй като данните не са били централизирани, те не са лесно достъпни.С оглед на това, всеки бъдещ анализ на резултатите, отвъд това, което е било получено и събрано, е ограничен. Подобно на други модели за машинно обучение, EXAM е ограничено от качеството на данните за обучението. Институциите, които се интересуват от внедряването на този алгоритъм за клинична грижа, трябва да разберат потенциалните предразсъдъци в обучението. Например, етикетите, използвани като основна истина в обучението на модела EXAM, са получени от 24- и 72-часовата консумация на кислород в пациента; се предполага, че кислородът, доставен на пациента, съответства на необходимостта от кислород. Въпреки това, в ранната фаза на пандемията COVID-19 много пациенти са били предоставени с кислород с висок поток профилактично независимо от техните нужди от кислород. Since our data access was limited, we did not have sufficient available information for the generation of detailed statistics regarding failure causes, post hoc, at most sites. However, we did study failure cases from the largest independent test site, CDH, and were able to generate hypotheses that we can test in the future. For high-performing sites, it seems that most failure cases fall into one of two categories: (1) low quality of input data—for example, missing data or motion artifact in CXR; or (2) out-of-distribution data—for example a very young patient. В бъдеще също така възнамеряваме да проучим потенциала за „популационен дрейф“ поради различните фази на прогресиране на болестта. A feature that would enhance these kinds of large-scale collaboration is the ability to predict the contribution of each client site towards improving the global FL model. This will help in client site selection, and in prioritization of data acquisition and annotation efforts. The latter is especially important given the high costs and difficult logistics of these large-consortia endeavors, and it will enable these endeavors to capture diversity rather than the sheer quantity of data samples. Future approaches may incorporate automated hyperparameter searching , neural architecture search и други автоматизирано машинно обучение Подходи за намиране на оптимални параметри за обучение за всеки клиент сайт по-ефективно. 55 56 57 Известни проблеми на нормализирането на партидите (BN) в FL motivated us to fix our base model for image feature extraction Бъдещата работа може да проучи различни видове техники за нормализиране, за да позволи обучението на моделите на AI в FL по-ефективно, когато данните на клиентите са ненезависими и идентично разпределени. 58 49 Recent works on privacy attacks within the FL setting have raised concerns on data leakage during model training Междувременно алгоритмите за защита остават неизследвани и ограничени от множество фактори. , , показва добра защита, те могат да отслабят производителността на модела. алгоритми за криптиране, като например хомоморфно криптиране Измерим начин за измерване на неприкосновеността на личния живот би позволил по-добри решения за определяне на необходимите минимални параметри за неприкосновеност на личния живот, като същевременно се поддържа клинично приемлива ефективност. , , . 59 36 48 49 60 36 48 49 След по-нататъшно валидиране, ние предвиждаме разгръщането на модела EXAM в настройката на ED като начин за оценка на риска както на ниво пациент, така и на ниво население, и за да предоставим на клиницистите допълнителна референтна точка при извършването на често трудна задача за скрининг на пациенти. Ние също така предвиждаме използването на модела като по-чувствителна метрия на ниво население, за да помогне за балансиране на ресурсите между регионите, болниците и отделите. Методи Етично одобрение Всички информирани процедури на Института за здравеопазване в Торонто са били проведени в съответствие с принципите за информирано съгласие за човешки експерименти, както са определени в Декларацията от Хелзинки и Международната конференция за хармонизиране на насоките за добра клинична практика в здравеопазването, и са одобрени от съответните институционални надзорни съвети в Beth Shore Newkner Hospital (всички осем от тези болници са били обхванати от информираното съгласие на борда за етика на MGB, No. 2020P002673, Бразилия и на следните обучителни сайтове: MGB, Mass General Hospital (MGH), Brigham and Women’s Hospital, Newton-Wellesley Hospital, North Shore Public Medical Center и New Faulkner Hospital). По същия Насоките на MI-CLAIM за докладване на клинични модели на ИИ са спазени (Допълнителна бележка) ) 2 Study setting В изследването са включени данни от 20 институции (фиг. ): MGB, MGH, Brigham and Women’s Hospital, Newton-Wellesley Hospital, North Shore Medical Center and Faulkner Hospital; Children’s National Hospital in Washington, DC; NIHR Cambridge Biomedical Research Centre; The Self-Defense Forces Central Hospital in Tokyo; National Taiwan University MeDA Lab and MAHC and Taiwan National Health Insurance Administration; Tri-Service General Hospital in Taiwan; Kyungpook National University Hospital in South Korea; Faculty of Medicine, Chulalongkorn University in Thailand; Diagnosticos da America SA in Brazil; University of California, San Francisco; VA San Diego; University of Toronto; National Institutes of Health in Bethesda, Maryland; University of Wisconsin-Madison School of Medicine and Public Health; Memorial Sloan Kettering Cancer Center in New York; and Mount Sinai Health System in New York. Institutions were recruited between March and May 2020. Dataset curation started in June 2020 and the final data cohort was added in September 2020. Between August and October 2020, 140 independent FL runs were conducted to develop the EXAM model and, by the end of October 2020, EXAM was made public on NVIDIA NGC , , . Data from three independent sites were used for independent validation: CDH, MVH and NCH, all in Massachusetts, USA. These three hospitals had patient population characteristics different from the training sites. The data used for the algorithm validation consisted of patients admitted to the ED at these sites between March 2020 and February 2021, and that satisfied the same inclusion criteria of the data used to train the FL model. 1a 61 62 63 Data collection The 20 client sites prepared a total of 16,148 cases (both positive and negative) for the purposes of training, validation and testing of the model (Fig. Клиентските сайтове се опитаха да включат всички COVID-положителни случаи от началото на пандемията през декември 2019 г. и до момента, в който започнаха местно обучение за проучването EXAM. Всички местни обучения бяха започнали до 30 септември 2020 г. Сайтовете включиха и други пациенти в същия период с отрицателни резултати от теста RT-PCR. Тъй като повечето сайтове имаха повече SARS-COV-2-отрицателни пациенти, отколкото положителни, ограничихме броя на включените отрицателни пациенти до най-много 95% от общите случаи на всеки клиентски сайт. 1б A ‘case’ included a CXR and the requisite data inputs taken from the patient’s medical record. A breakdown of the cohort size of the dataset for each client site is shown in Fig. Разпределението и моделите на интензивността на CXR изображението (пикселни стойности) варират значително между сайтовете поради множество фактори, специфични за пациента и сайта, като например различни производители на устройства и протоколи за изобразяване, както е показано на фигурата. . Patient age and EMR feature distribution varied greatly among sites, as expected owing to the differing demographics between globally distributed hospitals (Extended Data Fig. ). 1b 1c,d 6 Patient inclusion criteria Критериите за включване на пациента са били: (1) пациентът е представен на болничната ЕД или еквивалент; (2) пациентът е имал RT-PCR тест, извършен по всяко време между представянето на ЕД и освобождаването от болницата; (3) пациентът е имал CXR в ЕД; и (4) записите на пациента са имали най-малко пет от стойностите на ЕМР, описани в таблицата. , all obtained in the ED, and the relevant outcomes captured during hospitalization. Of note, The CXR, laboratory results and vitals used were the first available for capture during the visit to the ED. The model did not incorporate any CXR, laboratory results or vitals acquired after leaving the ED. 1 Модел на входа Етикетите на резултатите (т.е. наземната истина) са разпределени въз основа на изискванията на пациента след 24- и 72-часови периоди от първоначалното приемане в ЕД. Подробен списък на изискваните характеристики и резултати на ЕМР може да се види в таблица . 1 Разпределението на кислородната обработка с помощта на различни устройства на различни клиентски обекти е показано в разширената фигура с данни. , който подробно описва използването на устройството при приемане в ED и след 24- и 72-часови периоди.Разликата в разпределението на наборите от данни между най-големите и най-малките клиентски сайтове може да се види в разширената фигура с данни. . 7 8 Броят на положителните случаи на COVID-19, както е потвърден от един RT-PCR тест, получен по всяко време между представянето на ЕД и освобождаването от болницата, е изброен в Допълнителната таблица. Всеки клиент е помолен да раздели на случаен принцип своя набор от данни на три части: 70% за обучение, 10% за валидиране и 20% за тестване.За 24- и 72-часови модели за прогнозиране на резултатите, случайни раздели за всеки от трите повтарящи се локални и FL експерименти за обучение и оценка са генерирани независимо. 1 Изпит за развитие на модела There is wide variation in the clinical course of patients who present to hospital with symptoms of COVID-19, with some experiencing rapid deterioration in respiratory function requiring different interventions to prevent or mitigate hypoxemia , Критично решение, взето по време на оценката на пациент в началната точка на грижите, или в ЕД, е дали пациентът е вероятно да се нуждае от по-инвазивни или ограничени от ресурсите контрамерки или интервенции (като MV или моноклонални антитела), и следователно трябва да получава рядка, но ефективна терапия, терапия с тясно съотношение риск-полза поради странични ефекти или по-високо ниво на грижи, като например приемане в интензивното отделение. . In contrast, a patient who is at lower risk of requiring invasive oxygen therapy may be placed in a less intensive care setting such as a regular ward, or even released from the ED for continuing self-monitoring at home . EXAM was developed to help triage such patients. 62 63 64 65 Моделът не е одобрен от нито един регулаторен орган в момента и трябва да се използва само за изследователски цели. EXAM score EXAM е обучен с помощта на FL; той произвежда риск резултат (известен като EXAM резултат) подобен на CORISK (Разширени данни от Фиг. ) and can be used in the same way to triage patients. It corresponds to a patient’s oxygen support requirements within two windows—24 and 72 h—after initial presentation to the ED. Extended Data Fig. illustrates how CORISK and the EXAM score can be used for patient triage. 27 9a 9б Chest X-ray images were preprocessed to select the anterior position image and exclude lateral view images, and then scaled to a resolution of 224 × 224. As shown in Extended Data Fig. , моделът обединява информация от функциите EMR и CXR (на базата на модифициран ResNet34 с пространствено внимание предварително обучени в набора от данни CheXpert) Мрежата Deep & Cross За да се конвергират тези различни типове данни, от всяко CXR изображение е извлечен 512-размерен вектор на функцията, използвайки предварително обучен ResNet34, с пространствено внимание, след което е съединен с функциите на EMR като вход за мрежата Deep & Cross. Крайният изход е била непрекъсната стойност в диапазона 0-1 за двете 24- и 72-часови прогнози, съответстващи на етикетите, описани по-горе, както е показано в разширените данни. Използвахме кръстосантропията като функция за загуба и „Адам“ като оптимизатор. Използвайте NVIDIA Clara Train SDK Средната AUC за задачите за класификация (≥LFO, ≥HFO/NIV или ≥MV) е изчислена и използвана като окончателна метрика за оценка, с нормализиране до нулева средна стойност и единична вариация. ) на 9a 66 67 68 9b 69 70 27 Определяне и нормализиране Алгоритъмът на MissForest was used to impute EMR features, based on the local training dataset. If an EMR feature was completely missing from a client site dataset, the mean value of that feature, calculated exclusively on data from MGB client sites, was used. Then, EMR features were rescaled to zero-mean and unit variance based on statistics calculated on data from the MGB client sites. 71 Подробности за сливането на данни EMR-CXR с помощта на мрежата Deep & Cross To model the interactions of features from EMR and CXR data at the case level, a deep-feature scheme was used based on a Deep & Cross network architecture Бинарните и категоричните характеристики за входовете на EMR, както и 512-измерните изображения в CXR, бяха трансформирани в сливащи се плътни вектори на реални стойности чрез вграждане и натрупване на слоеве. Трансформираните плътни вектори служиха като вход към рамката за сливане, която специално използваше мрежа за пресичане, за да наложи сливане между входовете от различни източници. Мрежата за пресичане извърши експлицитно пресичане на функции в своите слоеве, като проведе вътрешни продукти между първоначалната функция за вход и изхода от предишния слой, като по този начин увеличи степента на взаимодействие между функциите. В същото време бяха обучени две индивидуални класически дълбоки невронни 68 ФЛ детайли Arguably the most established form of FL is implemention of the federated averaging algorithm as proposed by McMahan et al. , или вариации от него. Този алгоритъм може да бъде реализиран с помощта на настройка клиент-сървър, където всеки участник действа като клиент. Може да се помисли за FL като метод, насочен към минимизиране на глобална загуба функция чрез намаляване на набор от локални загуби функции, които се оценяват на всеки сайт. Чрез минимизиране на локалната загуба на всеки клиент сайт, а също така синхронизиране на научените тежести на клиентски сайт на централизиран сървър за агрегиране, може да се минимизира глобалната загуба, без да се налага достъп до целия набор от данни в централизирано местоположение. Всеки клиент сайт се учи локално и споделя актуализации на теглото на модела с централен сървър, който агрегира прино ) на 72 9С Псевдоалгоритъм на FL е показан в Допълнителна бележка В нашите експерименти ние зададохме броя на федеративните кръгове на = 200, с една местна тренировъчна епоха на кръг на всеки клиент. броят на клиентите, , was up to 20 depending on the network connectivity of clients or available data for a specific targeted outcome period (24 or 72 h). The number of local training iterations, , зависи от размера на набора от данни на всеки клиент и се използва за претегляне на приноса на всеки клиент при агрегиране на теглото на модела в федеративна средна стойност. По време на задачата за обучение FL всеки клиентски сайт избира своя най-добър локален модел, като проследява представянето на модела в своя локален комплект за валидиране.В същото време сървърът определя най-добрия глобален модел въз основа на средните оценки за валидиране, изпратени от всеки клиентски сайт на сървъра след всеки FL кръг.След завършване на обучението FL, най-добрите локални модели и най-добрият глобален модел се споделят автоматично с всички клиентски сайтове и се оценяват на техните локални тестови данни. 1 T t K НК k When training on local data only (the baseline), we set the epoch number to 200. The Adam optimizer was used for both local training and FL with an initial learning rate of 5 × 10–5 and a stepwise learning rate decay with a factor 0.5 after every 40 epochs, which is important for the convergence of federated averaging Случайни афинирани трансформации, включително въртене, преводи, рязане, мащабиране и случайно интензивен шум и измествания, бяха приложени към изображенията за увеличаване на данните по време на обучението. 73 Поради чувствителността на BN слоевете when dealing with different clients in a nonindependent and identically distributed setting, we found the best model performance occurred when keeping the pretrained ResNet34 with spatial attention parameters fixed during FL training (that is, using a learning rate of zero for those layers). The Deep & Cross network that combines image features with EMR features does not contain BN layers and hence was not affected by BN instability issues. 58 47 В това проучване изследвахме схема за запазване на неприкосновеността на личния живот, която споделя само частични актуализации на модела между сървъра и клиентски сайтове. Актуализациите на теглото бяха класирани по време на всяка итерация по размер на приноса и само определен процент от най-големите актуализации на теглото бяха споделени със сървъра. б) разширени данни на фиг. , която е изчислена от всички не-нулеви градиенти, Δ , and could be different for each client Във всеки кръг Вариациите на тази схема могат да включват допълнително отрязване на големи градиенти или диференциални схеми за поверителност. които добавят случайни шумове към градиентите или дори към суровите данни, преди да се захранват в мрежата . k 5 Къща(т) k t 49 51 Statistical analysis We conducted a Wilcoxon signed-rank test to confirm the significance of the observed improvement in performance between the locally trained model and the FL model for the 24- and 72-h time points (Fig. and Extended Data Fig. Нулевата хипотеза е отхвърлена с едностранно « 1 × 10–3 in both cases. 2 1 P Корелацията на Пиърсън се използва за оценка на генерализируемостта (устойчивостта на средната стойност на AUC към данните от тестовете на други клиентски сайтове) на локално обучени модели по отношение на размера на съответния локален набор от данни. = 0.43, = 0.035, степени на свобода (df) = 17 за 24-часовия модел и от 0,62 = 0,003, df = 16 за модела 72-h).Това показва, че само размерът на набора от данни не е единственият фактор, определящ устойчивостта на модела към невидими данни. r P r P To compare ROC curves from the global FL model and local models trained at different sites (Extended Data Fig. ), ние стартирахме 1000 проби от данните и изчислихме получените AUC. След това изчислихме разликата между двете серии и стандартизираме с помощта на формулата = (AUC1 – AUC2) или , where Това е стандартизираната разлика. е стандартното отклонение на различията за стартиране и AUC1 и AUC2 са съответните серии за стартиране на AUC. с нормално разпределение, ние получихме values illustrated in Supplementary Table Резултатите показват, че нулевата хипотеза е отхвърлена с много ниска стойност. values, indicating the statistical significance of the superiority of FL outcomes. The computation of стойностите са проведени в R с библиотеката pROC . 3 D s D s D P 2 P P 74 Since the model predicts a discrete outcome, a continuous score from 0 to 1, a straightforward calibration evaluation such as a qqplot is not possible. Hence, for a quantified estimate of calibration we quantified discrimination (Extended Data Fig. ). We conducted one-way analysis of variation (ANOVA) tests to compare local and FL model scores among four ground truth categories (RA, LFO, HFO, MV). The -Статистиката, изчислена като вариация между пробите, разделена на вариация в пробите и представляваща степента на дисперсия между различните групи, е използвана за количествено определяне на моделите. - стойностите на пет различни локални обекта са 245.7, 253.4, 342.3, 389.8 и 634.8, докато тази на модела FL е 843.5. - стойностите означават, че групите са по-разделими, резултатите от нашия модел FL ясно показват по-голямо разсейване между четирите основни категории истина. value of the ANOVA test on the FL model is <2 × 10–16, indicating that the FL prediction scores are statistically significantly different among the different prediction classes. 10 F F F P Докладване на резюме Further information on research design is available in the linked to this article. Резюме на изследванията в областта на природата Наличност на данните Данните от 20-те института, участвали в това проучване, остават под тяхна грижа. Тези данни са били използвани за обучение на всеки от местните сайтове и не са били споделени с никоя от другите участващи институции или с федералния сървър, и те не са публично достъпни. Данните от независимите сайтове за валидиране се поддържат от CAMCA и достъпът може да бъде поискан чрез контакт с Q.L. Въз основа на определяне от CAMCA, преглед на споделянето на данни и изменение на IRB за изследователски цели може да се извърши от изследователската администрация на MGB и в съответствие с IRB и политиката на MGB. Code availability Всички кодове и софтуер, използвани в това проучване, са публично достъпни в NGC. За да получите достъп, да влезете като гост или да създадете профил, въведете един от URL адресите по-долу. : на Федерираният софтуер за обучение е наличен като част от Clara Train SDK: Алтернативно, използвайте тази команда, за да изтеглите модела "wget --content-disposition -Заявление за изготвяне на изпит за изпит за изпит за изпит за изпит за изпит за изпит за изпит за изпит за изпит. 61 https://ngc.nvidia.com/catalog/models/nvidia:med:clara_train_covid19_exam_ehr_xray https://ngc.nvidia.com/catalog/containers/nvidia:clara-train-sdk https://api.ngc.nvidia.com/v2/models/nvidia/med/clara_train_covid19_exam_ehr_xray/versions/1/zip Референции Budd, J. et al. Digital technologies in the public-health response to COVID-19. , 1183–1192 (2020). Nat. Med. 26 Moorthy, V., Henao Restrepo, A. M., Preziosi, M.-P. & Swaminathan, S. Data sharing for novel coronavirus (COVID-19). , 150 (2020). Bull. World Health Organ. 98 Chen, Q., Allot, A. & Lu, Z. Keep up with the latest coronavirus research. , 193 (2020). Nature 579 Fabbri, F., Bhatia, A., Mayer, A., Schlotter, B. & Kaiser, J. BCG IT spend pulse: how COVID-19 is shifting tech priorities. (2020). https://www.bcg.com/publications/2020/how-covid-19-is-shifting-big-it-spend Candelon, F., Reichert, T., Duranton, S., di Carlo, R. C. & De Bondt, M. The rise of the AI-powered company in the postcrisis world. (2020). https://www.bcg.com/en-gb/publications/2020/business-applications-artificial-intelligence-post-covid Chao, H. et al. Integrative analysis for COVID-19 patient outcome prediction. , 101844 (2021). Med. Image Anal. 67 Zhu, X. et al. Joint prediction and time estimation of COVID-19 developing severe symptoms using chest CT scan. , 101824 (2021). Med. Image Anal. 67 Yang, D. et al. Federated semi-supervised learning for Covid region segmentation in chest ct using multi-national data from China, Italy, Japan. , 101992 (2021). Med. Image Anal. 70 Minaee, S., Kafieh, R., Sonka, M., Yazdani, S. & Jamalipour Soufi, G. Deep-COVID: predicting COVID-19 from chest X-ray images using deep transfer learning. , 101794 (2020). Med. Image Anal. 65 COVID-19 Studies from the World Health Organization Database. (2020). https://clinicaltrials.gov/ct2/who_table ACTIV. (2020). https://www.nih.gov/research-training/medical-research-initiatives/activ Coronavirus Treatment Acceleration Program (CTAP). US Food and Drug Administration (2020). https://www.fda.gov/drugs/coronavirus-covid-19-drugs/coronavirus-treatment-acceleration-program-ctap Gleeson, P., Davison, A. P., Silver, R. A. & Ascoli, G. A. A commitment to open source in neuroscience. , 964–965 (2017). Neuron 96 Piwowar, H. et al. The state of OA: a large-scale analysis of the prevalence and impact of open access articles. , e4375 (2018). PeerJ. 6 European Society of Radiology (ESR). What the radiologist should know about artificial intelligence – an ESR white paper. , 44 (2019). Insights Imaging 10 Pesapane, F., Codari, M. & Sardanelli, F. Artificial intelligence in medical imaging: threat or opportunity? Radiologists again at the forefront of innovation in medicine. , 35 (2018). Eur. Radiol. Exp. 2 Price, W. N. 2nd & Cohen, I. G. Privacy in the age of medical big data. , 37–43 (2019). Nat. Med. 25 Liang, W. et al. Development and validation of a clinical risk score to predict the occurrence of critical illness in hospitalized patients with COVID-19. , 1081–1089 (2020). JAMA Intern. Med. 180 Wynants, L. et al. Prediction models for diagnosis and prognosis of covid-19 infection: systematic review and critical appraisal. , m1328 (2020). Brit. Med. J. 369 Zhang, L. et al. D-dimer levels on admission to predict in-hospital mortality in patients with Covid-19. , 1324–1329 (2020). J. Thromb. Haemost. 18 Sands, K. E. et al. Patient characteristics and admitting vital signs associated with coronavirus disease 2019 (COVID-19)-related mortality among patients admitted with noncritical illness. (2020). https://doi.org/10.1017/ice.2020.461 American College of Radiology. CR recommendations for the use of chest radiography and computed tomography (CT) for suspected COVID-19 infection. (2020). https://www.acr.org/Advocacy-and-Economics/ACR-Position-Statements/Recommendations-for-Chest-Radiography-and-CT-for-Suspected-COVID19-Infection Rubin, G. D. et al. The role of chest imaging in patient management during the COVID-19 pandemic: a multinational consensus statement from the Fleischner Society. , 172–180 (2020). Radiology 296 World Health Organization. Use of chest imaging in COVID-19. (2020). https://www.who.int/publications/i/item/use-of-chest-imaging-in-covid-19 Jamil, S. et al. Diagnosis and management of COVID-19 disease. , 10 (2020). Am. J. Respir. Crit. Care Med. 201 Redmond, C. E., Nicolaou, S., Berger, F. H., Sheikh, A. M. & Patlas, M. N. Emergency radiology during the COVID-19 pandemic: The Canadian Association of Radiologists Recommendations for Practice. , 425–430 (2020). Can. Assoc. Radiologists J. 71 Buch, V. et al. Development and validation of a deep learning model for prediction of severe outcomes in suspected COVID-19 Infection. Preprint at (2021). https://arxiv.org/abs/2103.11269 Lyons, C. & Callaghan, M. The use of high-flow nasal oxygen in COVID-19. , 843–847 (2020). Anaesthesia 75 Whittle, J. S., Pavlov, I., Sacchetti, A. D., Atwood, C. & Rosenberg, M. S. Respiratory support for adult patients with COVID-19. , 95–101 (2020). J. Am. Coll. Emerg. Physicians Open 1 Ai, J., Li, Y., Zhou, X. & Zhang, W. COVID-19: treating and managing severe cases. , 370–371 (2020). Cell Res. 30 Esteva, A. et al. A guide to deep learning in healthcare. , 24–29 (2019). Nat. Med. 25 Cahan, E. M., Hernandez-Boussard, T., Thadaney-Israni, S. & Rubin, D. L. Putting the data before the algorithm in big data addressing personalized healthcare. , 78 (2019). NPJ Digit. Med. 2 Thrall, J. H. et al. Artificial intelligence and machine learning in radiology: opportunities, challenges, pitfalls, and criteria for success. , 504–508 (2018). J. Am. Coll. Radiol. 15 Shilo, S., Rossman, H. & Segal, E. Axes of a revolution: challenges and promises of big data in healthcare. , 29–38 (2020). Nat. Med. 26 Gao, Y. & Cui, Y. Deep transfer learning for reducing health care disparities arising from biomedical data inequality. , 5131 (2020). Nat. Commun. 11 Rieke, N. et al. The future of digital health with federated learning. , 119 (2020). NPJ Dig. Med. 3 Yang, Q., Liu, Y., Chen, T. & Tong, Y. Federated machine learning: concept and applications. , 12 (2019). ACM Trans. Intell. Syst. Technol. 10 Ma, C. et al. On safeguarding privacy and security in the framework of federated learning. , 242–248 (2020). IEEE Netw. 34 Brisimi, T. S. et al. Federated learning of predictive models from federated Electronic Health Records. , 59–67 (2018). Int. J. Med. Inform. 112 Roth, H. R. et al. Federated learning for breast density classification: a real-world implementation. In , (eds. Albarqouni, S. et al.) Vol. 12,444, 181–191 (Springer International Publishing, 2020). Proc. Second MICCAI Workshop, DART 2020 and First MICCAI Workshop, DCL 2020 Domain Adaptation and Representation Transfer, and Distributed and Collaborative Learning Sheller, M. J. et al. Federated learning in medicine: facilitating multi-institutional collaborations without sharing patient data. , 12598 (2020). Sci. Rep. 10 Remedios, S. W., Butman, J. A., Landman, B. A. & Pham, D. L. in (eds Remedios, S. W. et al.) (Springer, 2020). Federated Gradient Averaging for Multi-Site Training with Momentum-Based Optimizers Xu, Y. et al. A collaborative online AI engine for CT-based COVID-19 diagnosis. Preprint at (2020). https://www.medrxiv.org/content/10.1101/2020.05.10.20096073v2 Raisaro, J. L. et al. SCOR: A secure international informatics infrastructure to investigate COVID-19. , 1721–1726 (2020). J. Am. Med. Inform. Assoc. 27 Vaid, A. et al. Federated learning of electronic health records to improve mortality prediction in hospitalized patients with COVID-19: machine learning approach. , e24207 (2021). JMIR Med. Inform. 9 Nino, G. et al. Pediatric lung imaging features of COVID-19: a systematic review and meta-analysis. , 252–263 (2021). Pediatr. Pulmonol. 56 Fredrikson, M., Jha, S. & Ristenpart, T. Model inversion attacks that exploit confidence information and basic countermeasures. In 1322–1333, (2015). Proc. 22nd ACM SIGSAC Conference on Computer and Communications Security https://doi.org/10.1145/2810103.2813677 Zhu, L., Liu, Z. & Han, S. in (eds Wallach, H. et al.) 14774–14784 (Curran Associates, Inc., 2019). Advances in Neural Information Processing Systems 32 Kaissis, G. A., Makowski, M. R., Rückert, D. & Braren, R. F. Secure, privacy-preserving and federated machine learning in medical imaging. , 305–311 (2020). Nat. Mach. Intell. 2 Li, W. et al. in 133–141 (Springer, 2019). Privacy-Preserving Federated Brain Tumour Segmentation Shokri, R. & Shmatikov, V. Privacy-preserving deep learning. In (2015). Proc. 53rd Annual Allerton Conference on Communication, Control, and Computing (Allerton) https://doi.org/10.1109/allerton.2015.7447103 Li, X. et al. Multi-site fMRI analysis using privacy-preserving federated learning and domain adaptation: ABIDE results. , 101765 (2020). Med. Image Anal. 65 Estiri, H. et al. Predicting COVID-19 mortality with electronic medical records. , 15 (2021). NPJ Dig. Med. 4 Jiang, G. et al. Harmonization of detailed clinical models with clinical study data standards. , 65–74 (2015). Methods Inf. Med. 54 Yang, D. et al. in . (2019). Searching Learning Strategy with Reinforcement Learning for 3D Medical Image Segmentation https://doi.org/10.1007/978-3-030-32245-8_1 Elsken, T., Metzen, J. H. & Hutter, F. Neural architecture search: a survey. , 1–21 (2019). J. Mach. Learning Res. 20 Yao, Q. et al. Taking human out of learning applications: a survey on automated machine learning. Preprint at (2019). https://arxiv.org/abs/1810.13306 Ioffe, S. & Szegedy, C. Batch normalization: accelerating deep network training by reducing internal covariate shift. In , PMLR , 448–456 (2015). Proc. 32nd International Conf. Machine Learning 37 Kaufman, S., Rosset, S. & Perlich, C. Leakage in data mining: formulation, detection, and avoidance. In , 556–563 (2011). Proc. 17th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining Zhang, C. et al. BatchCrypt: efficient homomorphic encryption for cross-silo federated learning. In , 493–506 (2020). Proc. 2020 USENIX Annual Technical Conference, ATC 2020 . (2020). Nvidia NGC Catalog: COVID-19 Related Models https://ngc.nvidia.com/catalog/models?orderBy=scoreDESC&pageNumber=0&query=covid&quickFilter=models&filters Marini, J. J. & Gattinoni, L. Management of COVID-19 respiratory distress. , 2329–2330 (2020). JAMA 323 Cook, T. M. et al. Consensus guidelines for managing the airway in patients with COVID-19: Guidelines from the Difficult Airway Society, the Association of Anaesthetists the Intensive Care Society, the Faculty of Intensive Care Medicine and the Royal College of Anaesthetist. , 785–799 (2020). Anaesthesia 75 Galloway, J. B. et al. A clinical risk score to identify patients with COVID-19 at high risk of critical care admission or death: an observational cohort study. , 282–288 (2020). J. Infect. 81 Kilaru, A. S. et al. Return hospital admissions among 1419 COVID-19 patients discharged from five U.S. emergency departments. , 1039–1042 (2020). Acad. Emerg. Med. 27 He, K., Zhang, X., Ren, S. & Sun, J. Deep residual learning for image recognition. In (2016). Proc. 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR) https://doi.org/10.1109/cvpr.2016.90 Irvin, J. et al. CheXpert: a large chest radiograph dataset with uncertainty labels and expert comparison. , 590–597 (2019). Proc. AAAI Conf. Artif. Intell. 33 Wang, R., Fu, B., Fu, G. & Wang, M. Deep & Cross network for Ad Click predictions. In Article no. 12 (2017). Proc. ADKDD’17 Abadi, M. et al. TensorFlow: asystem for large-scale machine learning. In , USENIX Association 265–283 (2016). 12th USENIX Symposium on Operating Systems Design and Implementation (OSDI 16) . (2020). NVIDIA Clara Imaging https://developer.nvidia.com/clara-medical-imaging Stekhoven, D. J. & Bühlmann, P. MissForest–non-parametric missing value imputation for mixed-type data. , 112–118 (2012). Bioinformatics 28 McMahan, H., Moore, E., Ramage, D., Hampson, S. & y Arcas, B. A. Communication-efficient learning of deep networks from decentralized data. (2017). http://proceedings.mlr.press/v54/mcmahan17a.html Hsieh, K., Phanishayee, A., Mutlu, O. & Gibbons, P. B. The non-IID data quagmire of decentralized machine learning. In PMLR 119 (2020). Proc. 37th International Conf. Machine Learning Robin, X. et al. pROC: an open-source package for R and S+ to analyze and compare ROC curves. , 77 (2011). BMC Bioinformatics 12 Признания МГБ благодари на следните лица за тяхната подкрепа: J. Brink, Отдел по радиология, Масачузетска обща болница, Бостън, MA; N. Guo, Център за напреднали медицински изчисления и анализ, Отдел по радиология, Масачузетска обща болница, Масачузетска обща болница, Бостън, MA; N. Neumark, Център за клинични изследвания, Масачузетски общ Brigham, Бостън, MA; T. Schultz, Център за биологични изображения, Масачузетска обща болница, Бостън, MA; N. Guo, Център за напреднали медицински изчисления и анализ, Отдел по радиология, Масачузетска обща болница, Масачузетска обща бол . The Faculty of Medicine, Chulalongkorn University thank the Ratchadapisek Sompoch Endowment Fund RA (PO) (no. 001/63) for the collection and management of COVID‐19-related clinical data and biological specimens for the Research Task Force, Faculty of Medicine, Chulalongkorn University. NIHR Cambridge Biomedical Research Centre thank A. Priest, who is supported by the NIHR (Cambridge Biomedical Research Centre at the Cambridge University Hospitals NHS Foundation Trust). National Taiwan University MeDA Lab and the MAHC and Taiwan National Health Insurance Administration thank the MOST Joint Research Center for AI technology, the All Vista Healthcare National Health Insurance Administration, Taiwan, the Ministry of Science and Technology, Taiwan and the National Center for Theoretical Sciences Mathematics Division. National Institutes of Health (NIH) acknowledge that the NIH Medical Research Scholars Program is a public–private partnership supported jointly by the NIH and by generous contributions to the Foundation for the NIH from the Doris Duke Charitable Foundation, the American Association for Dental Research, the Colgate-Palmolive Company, Genentech, alumni of student research programs and other individual supporters via contributions to the Foundation for the NIH. https://data.ucsf.edu/covid19 Тази статия е достъпна в натура под лиценза CC by 4.0 Deed (Attribution 4.0 International). Тази хартия е Създаден е под лиценза CC by 4.0 Deed (Attribution 4.0 International). На разположение в природата