Авторы : Ittai Dayan Holger R. Roth Аоксиао Чжун Ahmed Harouni Amilcare Gentili Anas Z. Abidin Andrew Liu Anthony Beardsworth Costa Bradford J. Wood Chien-Sung Tsai Chih-Hung Wang Chun-Nan Hsu C. K. Lee Peiying Ruan Daguang Xu Dufan Wu Эдди Хуанг Felipe Campos Kitamura Griffin Lacey Gustavo César de Antônio Corradi Gustavo Nino Хао-Хсин Шин Hirofumi Obinata Hui Ren Jason C. Crane Джесси Тетреаут Jiahui Guan John W. Garrett Joshua D. Kaggie Jung Gil Park Keith Dreyer Krishna Juluru Kristopher Kersten Marcio Aloisio Bezerra Cavalcanti Rockenbach Marius George Linguraru Masoom A. Haider Meena AbdelMaseeh Никола Рике Pablo F. Damasceno Pedro Mario Cruz e Silva Pochuan Wang Sheng Xu Shuichi Kawano Sira Sriswasdi Soo Young Park Thomas M. Grist Varun Buch Watsamon Jantarabenjakul Weichung Wang Won Young Tak Xiang Li Xihong Lin Young Joon Kwon Abood Quraini Andrew Feng Andrew N. Priest Baris Turkbey Benjamin Glicksberg Bernardo Bizzo Byung Seok Kim Carlos Tor-Díez Chia-Cheng Lee Chia-Jung Hsu Chin Lin Chiu-Ling Lai Christopher P. Hess Colin Compas Deepeksha Bhatia Eric K. Oermann Evan Leibovitz Hisashi Sasaki Hitoshi Mori Isaac Yang Jae Ho Sohn Krishna Nand Keshava Murthy Li-Chen Fu Matheus Ribeiro Furtado de Mendonça Mike Fralick Min Kyu Kang Mohammad Adil Natalie Gangai Peerapon Vateekul Pierre Elnajjar Sarah Hickman Sharmila Majumdar Shelley L. McLeod Sheridan Reed Stefan Gräf Stephanie Harmon Tatsuya Kodama Thanyawee Puthanakit Tony Mazzulli Vitor Lima de Lavor Yothin Rakvongthai Yu Rim Lee Yuhong Wen Fiona J. Gilbert Mona G. Flores Quanzheng Li Авторы : Итай Даян Холгер Р. Рот Аоксиао Чжун Ахмед Харуни Амилькар Джентиль Анас З. Абидин Андрей Лю Энтони Беардсуорт Коста Брэдфорд Джей Вуд ЧИЕН-СОНГ ЦАЙ Чих-Хонг Ван Чун-Нан Хсу К. К. Ли Пекин Руан Дагуан Су Дуфан Ву Эдди Хуанг Фелипе Кампос Китамура Грифин Лейси Густав Цезарь Антонио Корради Густав Нино Хао-Хсин Шин Хирофуми Обината Хуй Рен Джейсон К. Крейн Джесси Тетреаут Джиахуи Гуан Джон В. Гарретт Джошуа Д. Кагги Парк Юнг Гил Кит Дрейер Кришна Юлюру Кристофер Керстен Марсио Алоисио Безерра Кавальканти Рокенбах Мариус Джордж Лингурару Масон А. Хайдер Мена Абдельмасех Никола Рике Пабло Ф. Дамаскено Педро Марио Круз и Сильва Похован Ванг Шэнь Чжу Шуичи Кавано Сира Срисвасди Сой Юный парк Томас М. Грист ВАРУН КНИГА Вечеринка Ватсамон Вьетнам Ванг Юный Вон так Цзян Ли Сихонг Лин Молодой Джоун Квон Абод Курайни Эндрю Фэн Эндрю Н. Прист Барис Туркменистан Бенджамин Гликсберг Бернардо Бизо Смотреть Ким Карлос Тор-Диз Чиа-Чен Ли Чиа-Юнг Хсу Чин Лин Чиу-Линг Лай Кристофер П. Хесс Колин Компас Deepeksha Бхатия Эрик К. Оерманн Эван Лейбовиц Хисаси Сасаки Хитоши Мори Исаак Ян Джей Хо Сын Кришна Нанд Кешава Мурти Ли-Чен Фу Матей Рибейро Фуртадо де Мендонса Майк Фралик Мин Киу Канг Мохаммед Адиль Натали Гангаи Перапон Ватеек Пьер Элнайяр Сара Хикман Шармила Маджумдар Шелли Л. МакЛёд Шеридан Рид Стефан Граф Стефани Хармон Тацуя Кодама Татьяна Путановская Тони Мазулли Виктор Лима от работы Иотин Раквонтай Ю Рим Ли Юхонг Уэн Фиона Джей Гилберт Мона Г. Флорес Кванчхен Ли абстрактный Федеративное обучение (FL) - это метод, используемый для обучения моделей искусственного интеллекта с данными из нескольких источников, сохраняя при этом анонимность данных, тем самым устраняя многие барьеры для обмена данными. Здесь мы использовали данные из 20 институтов по всему миру, чтобы обучить модель FL, называемую EXAM (электронная медицинская запись (EMR) грудная рентгеновская AI модель), которая предсказывает будущие потребности в кислороде симптоматических пациентов с COVID-19 с использованием входов жизненных признаков, лабораторных данных и рентгеновских лучей грудной клетки. ЭКСАМ достиг средней площади под кривой (AUC) > 0,92 для прогнозирования результатов в 24 и 72 часах с момента первоначального представления в экстренную комнату главный Научные, академические, медицинские и научные сообщества объединились перед лицом пандемического кризиса COVID-19, чтобы быстро оценить новые парадигмы в области искусственного интеллекта (ИИ), которые бывают быстрыми и безопасными, и потенциально стимулировать обмен данными и обучение моделям и тестирование без привычных барьеров для конфиденциальности и собственности на данные традиционных совместных проектов. , Провайдеры здравоохранения, исследователи и промышленность сфокусировались на удовлетворении неудовлетворенных и критических клинических потребностей, созданных кризисом, с замечательными результатами. , , , , , , Набор клинических испытаний был ускорен и облегчен национальными регулирующими органами и международным духом сотрудничества , , Дисциплины анализа данных и ИИ всегда способствовали открытым и совместным подходам, включая такие концепции, как программное обеспечение с открытым исходным кодом, воспроизводимые исследования, хранилища данных и предоставление анонимных наборов данных публично. , Пандемия подчеркнула необходимость оперативного проведения совместных исследований данных, которые позволят клиническим и научным сообществам реагировать на быстро развивающиеся и широко распространенные глобальные вызовы. , , . 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 Конкретным примером таких типов сотрудничества является наша предыдущая работа по модели клинической поддержки решений SARS-COV-2 (CDS), основанной на ИИ. Эта модель CDS была разработана в Mass General Brigham (MGB) и была подтверждена по данным нескольких систем здравоохранения.Входы к модели CDS были изображениями рентгеновских лучей грудной клетки (CXR), жизненно важными признаками, демографическими данными и лабораторными значениями, которые были показаны в предыдущих публикациях, чтобы предсказать результаты пациентов с COVID-19 , , , CXR был выбран в качестве ввода изображения, потому что он широко доступен и обычно указывается руководящими принципами, такими как те, которые предоставляет ACR. Общество Fleischner По данным ВОЗ Национальные грудные общества Национальное министерство здравоохранения COVID Руководства и радиологические общества по всему миру Выходом модели CDS был балл, названный CORISK , что соответствует требованиям к поддержке кислорода и что может помочь в тестировании пациентов врачами первой линии , , Известно, что поставщики услуг здравоохранения предпочитают модели, которые были подтверждены своими собственными данными. На сегодняшний день большинство моделей ИИ, включая вышеупомянутую модель CDS, были обучены и проверены на «узких» данных, которые часто не имеют разнообразия. , Это может быть смягчено путем обучения с различными данными с нескольких сайтов без централизации данных Использование таких методов, как трансферное обучение , FL является методом, используемым для обучения моделей ИИ по различным источникам данных, без того, чтобы данные транспортировались или раскрывались за пределами их первоначального местоположения. . 18 19 20 21 22 23 24 25 26 27 28 29 30 27 31 32 33 34 35 36 Федеративное обучение поддерживает быстрый запуск централизованных экспериментов с улучшенной прослеживаемостью данных и оценкой алгоритмических изменений и воздействия Один подход к FL, называемый клиент-сервер, посылает «нетренированную» модель на другие серверы («узлы»), которые выполняют частичные тренировочные задачи, в свою очередь, отправляя результаты обратно для слияния в центральном («федеративном») сервере. . 37 36 Управление данными для FL поддерживается локально, облегчая проблемы с конфиденциальностью, с только весами моделей или градиентами, сообщаемыми между клиентскими сайтами и федеративным сервером , FL уже продемонстрировала обещание в недавних приложениях медицинского изображения , , , , в том числе в анализе COVID-19 , , Замечательным примером является модель прогнозирования смертности у пациентов, инфицированных SARS-COV-2, которая использует клинические особенности, хотя и ограниченные по количеству методов и масштаба. . 38 39 40 41 42 43 8 44 45 46 Наша цель состояла в том, чтобы разработать надежную, обобщаемую модель, которая могла бы помочь в тестировании пациентов. Мы теоретизировали, что модель CDS может быть успешно федерализована, учитывая ее использование входов данных, которые относительно распространены в клинической практике и которые не зависят в значительной степени от оператор-зависимых оценок состояния пациента (таких как клинические впечатления или сообщенные симптомы). Вместо этого были использованы лабораторные результаты, жизненные признаки, исследование изображений и часто захватываемая демографическая (т.е. возрастная) модель. Поэтому мы переподготовили модель CDS с различными данными с использованием подхода FL-клиент-сервер для разработки новой глобальной модели FL, которая была названа EXAM, используя входные функции Наша гипотеза заключалась в том, что ЭКСАМ будет работать лучше, чем местные модели, и будет лучше обобщать системы здравоохранения. Результаты Модель архитектуры экзамена Модель EXAM основана на модели CDS, упомянутой выше. В общей сложности в качестве ввода в модель были использованы 20 характеристик (19 из EMR и один CXR). Этикетки результата (т.е. «полевая правда») были присвоены на основе терапии пациентом кислородом после 24-х и 72-часовых периодов с момента первоначального приема в отделение экстренной помощи (ED). Подробный список запрошенных характеристик и результатов можно увидеть в таблице . 27 1 Этикетки результатов пациентов были установлены на 0, 0,25, 0,50 и 0,75 в зависимости от наиболее интенсивной кислородной терапии, которую пациент получил в предсказательном окне. Категории кислородной терапии были, соответственно, комнатный воздух (РА), низкий поток кислорода (LFO), высокий поток кислорода (HFO)/неинвазивная вентиляция (NIV) или механическая вентиляция (MV). Если пациент умер в предсказательном окне, этикетка результата была установлена на 1. Для функций EMR использовались только первые значения, захваченные в ED, а предварительная обработка данных включала деидентификацию, импутацию недостающих значений и нормализацию до нулевой средней и единичной вариации. Таким образом, модель объединяет информацию из функций EMR и CXR, используя 34-слойную конволюционную нейронную сеть (ResNet34) для извлечения функций из CXR и сети Deep & Cross, чтобы соединить функции вместе с функциями EMR (для более подробной информации см. Выход модели представляет собой балл по риску, называемый баллом EXAM, который представляет собой непрерывное значение в диапазоне 0–1 для каждого из 24- и 72-часовых прогнозов, соответствующих этикеткам, описанным выше. Методы Федерализация модели Модель EXAM была подготовлена с использованием когорты из 16,148 случаев, что делает ее не только одной из первых моделей FL для COVID-19, но и очень большим и многоконтинентальным проектом развития клинически значимого ИИ (рис. Данные между сайтами не были гармонизированы до извлечения и, в свете реальных обстоятельств клинической информатики, тщательная гармонизация ввода данных не проводилась авторами (рис. ) 1а, б 1С, Д Карта мира, показывающая 20 различных клиентских сайтов, вносящих вклад в исследование EXAM. , Количество дел, вносимых каждым учреждением или сайтом (клиент 1 представляет сайт, внесший наибольшее количество дел). Распределение рентгеновской интенсивности грудной клетки на каждом участке клиента. , Возраст пациентов на каждом клиентском сайте, показывающий минимальный и максимальный возраст (астерики), средний возраст (треугольники) и стандартное отклонение (горизонтальные полосы). . a b c d 1 Мы сравнили локально обученные модели с глобальной моделью FL на данных теста каждого клиента. 1 × 10–3, тест с подписью Уилкоксона) 16% (как определено средней AUC при выполнении модели на соответствующих местных испытательных наборах: от 0,795 до 0,920, или 12,5 процентных пунктов) (рис. Это также привело к 38% улучшению генерализации (как определено средней AUC при выполнении модели на всех тестовых наборах: от 0,667 до 0,920, или 25,3 процентных пункта) лучшей глобальной модели для прогнозирования 24-часовой кислородной обработки по сравнению с моделями, обученными только на собственных данных сайта (рис. Для результатов прогнозирования 72-часовой кислородной обработки лучшая глобальная модель обучения привела к среднему улучшению производительности на 18% по сравнению с локально обученными моделями, в то время как обобщаемость глобальной модели улучшилась в среднем на 34% (Фиг. Стабильность наших результатов была подтверждена путем повторения трех курсов местного и FL-тренинга на разных рандомизированных сплитах данных. P 2а 2б 1 , Показатель на каждом тесте клиента установлен в прогнозе 24-часовой кислородной обработки для моделей, обученных только на локальных данных (Local) против лучшей глобальной модели, доступной на сервере (FL (см. лучшее). , Обобщаемость (средняя производительность на данных об испытаниях других сайтов, представленная средней AUC) как функция размера набора данных клиента (нет случаев).Зеленая горизонтальная линия обозначает производительность обобщаемости лучшей глобальной модели. ) и у клиента 14 были случаи только с лечением РА, так что метрика оценки (по AUC) не применялась ни в одном из этих случаев ( Данные для клиента 14 также были исключены из расчета средней обобщаемости в локальных моделях. a b 1 Методы Местные модели, которые были обучены с использованием несбалансированных когорт (например, в основном легкие случаи COVID-19) заметно выиграли от подхода FL, с существенным улучшением в прогнозируемой средней производительности AUC для категорий с лишь несколькими случаями.Это было очевидно на клиентском сайте 16 (несбалансированный набор данных), с большинством пациентов, испытывающих легкую тяжесть заболевания и только с несколькими тяжелыми случаями.Модель FL достигла более высокой истинно-положительной нормы для двух положительных (серьезных) случаев и заметно более низкой ложно-положительной нормы по сравнению с локальной моделью, как показано в схемах операционной характеристики реципиента (ROC) и матрицах путаницы ( Расширенный фиг данных. Более важно, что генерализация модели FL значительно увеличилась по сравнению с локально обученной моделью. 3а 2 ROC на клиентском сайте 16, с несбалансированными данными и преимущественно мягкими случаями. , ROC of the local model at client site 12 (a small dataset), mean ROC of models trained on larger datasets corresponding to the five client sites in the Boston area (1, 4, 5, 6, 8) and ROC of the best global model in prediction of 72-h oxygen treatment for different thresholds of EXAM score (left, middle, right). The mean ROC is calculated based on five locally trained models while the gray area denotes the ROC standard deviation. ROCs for three different cutoff values ( Pos и neg обозначают количество положительных и отрицательных случаев соответственно, как определено этим диапазоном экзаменных баллов. a b t In the case of client sites with relatively small datasets, the best FL model markedly outperformed not only the local model but also those trained on larger datasets from five client sites in the Boston area of the USA (Fig. ) 3Б The global model performed well in predicting oxygen needs at 24/72 h in patients both COVID positive and negative (Extended Data Fig. ) 3 Валидация на независимых сайтах Following initial training, EXAM was subsequently tested at three independent validation sites: Cooley Dickinson Hospital (CDH), Martha’s Vineyard Hospital (MVH) and Nantucket Cottage Hospital (NCH), all in Massachusetts, USA. The model was not retrained at these sites and it was used only for validation purposes. The cohort size and model inference results are summarized in Table , и кривые ROC и матрицы путаницы для крупнейшего набора данных (от CDH) показаны на рисунке. Операционная точка была установлена для дифференциации между немеханической вентиляцией и механической вентиляцией (MV) обработки (или смерти). глобальная обученная модель FL, EXAM, достигла средней AUC 0,944 и 0,924 для задач прогнозирования 24 и 72 ч соответственно (Таблица). Для прогнозирования лечения MV (или смерти) в 24 ч, EXAM достиг чувствительности 0,950 и специфичности 0,882 при CDH, и чувствительности 1000 специфичности 0,934 при MVH. NCH не имел никаких случаев с MV/смерть в 24 ч. В отношении 72-часового прогноза MV, EXAM достиг чувствительности 0,929 и специфичности 0,880 при CDH, чувствительности 1000 и специфичности 0,976 при MVH и чувствительности 1000 и специфичности 0,929 при NCH. 2 4 2 , , Производительность (ROC) (верхняя) и матрицы путаницы (нижняя) модели EXAM FL на наборе данных CDH для прогнозирования потребности в кислороде в 24 часах ( в течение 72 часов ( ) ROC для трех различных значений резания ( ) of the EXAM risk score are shown. a b a b t For MV at CDH at 72 h, EXAM had a low false-negative rate of 7.1%. Representative failure cases are presented in Extended Data Fig. , показывая два ложноотрицательных случая от CDH, где один случай имел много отсутствующих функций данных EMR, а другой имел CXR с артефактом движения и некоторыми отсутствующими функциями EMR. 4 Использование дифференциальной конфиденциальности Основная мотивация, по которой учреждения здравоохранения используют FL, заключается в сохранении безопасности и конфиденциальности своих данных, а также соблюдении мер соответствия данным. или даже реконструкция тренировочных изображений из самих градиентов модели . To counter these risks, security-enhancing measures were used to mitigate risk in the event of data ‘interception’ during site-server communication . We experimented with techniques to avoid interception of FL data, and added a security feature that we believe could encourage more institutions to use FL. We thus validated previous findings showing that partial weight sharing, and other differential privacy techniques, can successfully be applied in FL С помощью расследования частичной схемы разделения веса , , , мы показали, что модели могут достигать сопоставимой производительности даже при использовании только 25% обновлений веса (расширенные данные. ) 47 48 49 50 50 51 52 5 Дискуссия Это исследование включает в себя большое, реальное исследование FL в области здравоохранения с точки зрения количества сайтов и количества используемых точек данных. Мы считаем, что оно обеспечивает мощное доказательство концепции возможности использования FL для быстрого и совместного разработки необходимых моделей ИИ в здравоохранении. Наше исследование включало несколько сайтов на четырех континентах и под контролем различных регулирующих органов, и таким образом держит обещание быть предоставленным различным регулируемым рынкам в ускоренном порядке. Глобальная модель FL, EXAM, доказала себя более прочной и достигла лучших результатов на отдельных сайтах, чем любая модель, обученная только на местных данных. Мы считаем, что последовательное улучшение было достигнуто благодаря большему, но также более разнообразному набору данных, использованию входов данных Для клиентского сайта с относительно небольшим набором данных можно было бы использовать два типичных подхода для совмещения полезной модели: один из них заключается в том, чтобы тренировать локально с собственными данными, а другой - применять модель, обученную на более крупном наборе данных. Для сайтов с небольшими наборами данных было бы практически невозможно построить эффективную модель глубокого обучения, используя только их локальные данные. Вывод, что эти два подхода превосходили по всем трем задачам прогнозирования глобальной моделью FL, указывает на то, что польза для клиентских сайтов с небольшими наборами данных, возникающими в результате участия в FL-сотрудничествах, существенна. Это, вероятно, отражение способности FL поймать больше разнообразия, чем местное обучение, и смягчить предрассудки, присутству . 46 Результаты валидации подтвердили, что глобальная модель является надежной, поддерживая нашу гипотезу о том, что модели, обученные FL, могут быть обобщены по системам здравоохранения. Они обеспечивают убедительный случай использования предсказующих алгоритмов в уходе за пациентами COVID-19 и использования FL в создании моделей и тестировании. Участвуя в этом исследовании, клиентские сайты получили доступ к ЭКЗАМ, для дальнейшей валидации перед любым регулирующим одобрением или будущим внедрением в клиническую помощь. , а также на различных сайтах, которые не были частью экзамена. 53 Over 200 prediction models to support decision-making in patients with COVID-19 have been published . Unlike the majority of publications focused on diagnosis of COVID-19 or prediction of mortality, we predicted oxygen requirements that have implications for patient management. We also used cases with unknown SARS-COV-2 status, and so the model could provide input to the physician ahead of receiving a result for PCR with reverse transcription (RT–PCR), making it useful for a real-life clinical setting. The model’s imaging input is used in common practice, in contrast with models that use chest computed tomography, a nonconsensual diagnostic modality. The model’s design was constrained to objective predictors, unlike many published studies that leveraged subjective clinical impressions. The data collected reflect varied incidence rates, and thus the ‘population momentum’ we encountered is more diverse. This implies that the algorithm can be useful in populations with different incidence rates. 19 Идентификация групп пациентов и гармонизация данных не являются новыми проблемами в научных исследованиях и науке о данных Улучшения в клинических информационных системах необходимы для рационализации подготовки данных, что приводит к лучшему использованию сети сайтов, участвующих в FL. Это, в сочетании с гиперпараметрической инженерией, может позволить алгоритмам «учиться» более эффективно из больших партий данных и адаптировать параметры модели к конкретному сайту для дальнейшей персонализации — например, путем дальнейшего тонкого настройки на этом сайте. Система, которая позволит беспрепятственно, ближе к реальному времени модели вывода и обработки результатов, также будет полезна и будет «закрыть цикл» от обучения к развертыванию модели. 54 39 Поскольку данные не были централизованы, они не легко доступны.Учитывая это, любой будущий анализ результатов, помимо того, что было получено и собрано, ограничен. Similar to other machine learning models, EXAM is limited by the quality of the training data. Institutions interested in deploying this algorithm for clinical care need to understand potential biases in the training. For example, the labels used as ground truth in the training of the EXAM model were derived from 24- and 72-h oxygen consumption in the patient; it is assumed that oxygen delivered to the patient equates the oxygen need. However, in the early phase of the COVID-19 pandemic, many patients were provided high-flow oxygen prophylactically regardless of their oxygen need. Such clinical practice could skew the predictions made by this model. Поскольку доступ к нашим данным был ограничен, у нас не было достаточного количества доступной информации для создания подробной статистики причин неисправностей на большинстве сайтов. однако, мы изучили случаи неисправностей с крупнейшего независимого сайта испытаний, CDH, и смогли создать гипотезы, которые мы могли бы проверить в будущем. Для сайтов с высокой производительностью, кажется, что большинство случаев неисправностей попадают в одну из двух категорий: (1) низкое качество входных данных — например, отсутствие данных или движущийся артефакт в CXR; или (2) данные, не распространяемые — например, очень молодой пациент. В будущем мы также намерены исследовать потенциал «дефляции населения» из-за различных фаз прогрессирования болезни. Особенностью, которая улучшит эти виды масштабного сотрудничества, является возможность прогнозировать вклад каждого клиентского сайта в улучшение глобальной модели FL. Это поможет в выборе клиентского сайта, а также в приоритетизации усилий по сбору данных и аннотации. Последняя особенно важна, учитывая высокие затраты и сложную логистику этих крупных консорциумов, и позволит этим усилиям улавливать разнообразие, а не чистый объем образцов данных. Future approaches may incorporate automated hyperparameter searching , neural architecture search и другие автоматизированные методы машинного обучения подходы к поиску оптимальных параметров обучения для каждого клиентского сайта более эффективно. 55 56 57 Известные проблемы нормализации партий (BN) в FL мотивировал нас исправить нашу базовую модель для извлечения функций изображения Будущая работа может исследовать различные типы методов нормализации, чтобы позволить обучению моделей ИИ в FL более эффективно, когда данные клиента не являются независимыми и идентично распределены. 58 49 Недавние работы по атакам на конфиденциальность в настройках FL вызвали обеспокоенность по поводу утечки данных во время обучения моделям Между тем, алгоритмы защиты остаются неисследованными и ограничены множеством факторов, в то время как дифференциальные алгоритмы конфиденциальности , , show good protection, they may weaken the model’s performance. Encryption algorithms, such as homomorphic encryption Измеримый способ измерения конфиденциальности позволил бы сделать лучший выбор для определения минимальных параметров конфиденциальности, необходимых при сохранении клинически приемлемой производительности , , . 59 36 48 49 60 36 48 49 После дальнейшей валидации мы предполагаем развертывание модели ЭКСАМ в настройках ЭД как способ оценки рисков как на уровне пациента, так и на уровне населения, и предоставить клиницистам дополнительную ориентировку при выполнении часто затруднительной задачи скрининга пациентов. Мы также предполагаем использование модели как более чувствительной метрики на уровне населения, чтобы помочь сбалансировать ресурсы между регионами, больницами и отделами. Методы Одобрение этики Все проинформированные процедуры Центра здравоохранения Калифорнии были проведены в соответствии с принципами, изложенными в Декларации Хельсинки и Международной конференции по гармонизации рекомендаций по хорошей клинической практике здравоохранения, и были одобрены соответствующими институциональными комитетами по обзору Beth Sinungner в следующих местах проверки: CDH, MVH, NCH и в следующих местах обучения: MGB, Mass General Hospital (MGH), Brigham and Women’s Hospital, Newton-Wellesley Hospital, San Shore Public Medical Center и New Newkner Hospital (все восемь из этих больниц были охвачены согласием совета по этике MGB, No. 2020P002673, а информированное согласие было отказано институциональным советом по обзору Руководящие принципы MI-CLAIM по отчетности клинических моделей ИИ были соблюдены (Дополнительная запись) ) 2 Исследование Setting The study included data from 20 institutions (Fig. MGB, MGH, Brigham and Women’s Hospital, Newton-Wellesley Hospital, North Shore Medical Center и Faulkner Hospital; Children’s National Hospital in Washington, DC; NIHR Cambridge Biomedical Research Centre; The Self-Defense Forces Central Hospital in Tokyo; National Taiwan University MeDA Lab и MAHC и Taiwan National Health Insurance Administration; Tri-Service General Hospital in Taiwan; Kyungpook National University Hospital in South Korea; Faculty of Medicine, Chulalongkorn University in Thailand; Diagnosticos da America SA in Brazil; University of California, San Francisco; VA San Diego; University of Toronto; National Institutes of Health in Bethesda, Maryland; University of Wisconsin-Madison School of Medicine and Public Health; Memorial Sloan Kettering Cancer Center in New York; and Mount Sinai Health System in , , Данные из трех независимых сайтов были использованы для независимой валидации: CDH, MVH и NCH, все в Массачусетсе, США. Эти три больницы имели особенности популяции пациентов, отличающиеся от мест обучения. Данные, используемые для валидации алгоритма, состояли из пациентов, допущенных к ЭД на этих сайтах в период с марта 2020 года по февраль 2021 года, и которые удовлетворяли тем же критериям включения, что и данные, используемые для обучения модели FL. 1а 61 62 63 Data collection The 20 client sites prepared a total of 16,148 cases (both positive and negative) for the purposes of training, validation and testing of the model (Fig. Медицинские данные были получены в отношении пациентов, которые удовлетворяли критериям включения в исследование. Клиентские сайты стремились включить все положительные случаи ВИЧ-инфекции с начала пандемии в декабре 2019 года и до тех пор, пока они не начали местную подготовку к исследованию ЭКСПО.Все местные тренинги начались к 30 сентября 2020 года.На сайтах также были включены другие пациенты в тот же период с отрицательными результатами тестов РТ-ПЦР.Поскольку большинство сайтов имели больше отрицательных пациентов SARS-COV-2, чем положительных, мы ограничили число включенных отрицательных пациентов до максимум 95% от общего числа случаев на каждом клиентском сайте. 1б Один «случай» включал CXR и необходимые входы данных, взятые из медицинской записи пациента. Распределение размера когорты набора данных для каждого клиентского сайта показано на Фиг. Распределение и модели интенсивности изображения CXR (значения пикселей) сильно варьировались между сайтами из-за множества факторов, специфических для пациента и сайта, таких как различные производители устройств и протоколы обработки изображений, как показано на рисунке. Возраст пациентов и распределение функций ЭМР сильно варьировались между местами, как ожидалось из-за различий в демографии между глобально распределенными больницами (расширенные данные Фиг. ) 1b 1С, Д 6 Критерии включения пациентов Patient inclusion criteria were: (1) patient presented to the hospital’s ED or equivalent; (2) patient had a RT–PCR test performed at any time between presentation to the ED and discharge from the hospital; (3) patient had a CXR in the ED; and (4) patient’s record had at least five of the EMR values detailed in Table , все полученные в ЭД, и соответствующие результаты, полученные во время госпитализации.Заметьте, CXR, лабораторные результаты и жизненные данные, используемые были первыми доступными для захвата во время визита в ЭД. Модель не включала никакие CXR, лабораторные результаты или жизненные данные, полученные после выхода из ЭД. 1 Модель ввода В общей сложности в качестве ввода в модель были использованы 21 характеристика ЭМР. Этикетки результата (т.е. наземная истина) были выделены на основании требований пациентов после 24-го и 72-го часов с момента первоначального приема в ЭД. Подробный список запрошенных особенностей ЭМР и результатов можно увидеть в таблице . 1 The distribution of oxygen treatment using different devices at different client sites is shown in Extended Data Fig. , который подробно описывает использование устройства при поступлении в ED и после 24-х и 72-х периодов.Разница в распределении наборов данных между самыми большими и самыми маленькими клиентскими сайтами можно увидеть на рисунке расширенных данных. . 7 8 Количество положительных случаев COVID-19, подтвержденное одним тестом РТ-ПЦР, полученным в любое время между представлением ЭД и выпиской из больницы, перечислены в Дополнительной таблице. . Each client site was asked to randomly split its dataset into three parts: 70% for training, 10% for validation and 20% for testing. For both 24- and 72-h outcome prediction models, random splits for each of the three repeated local and FL training and evaluation experiments were independently generated. 1 Экзаменационная модель развития There is wide variation in the clinical course of patients who present to hospital with symptoms of COVID-19, with some experiencing rapid deterioration in respiratory function requiring different interventions to prevent or mitigate hypoxemia , Критическое решение, принятое при оценке пациента в начальной точке ухода или в ЭД, заключается в том, что пациент, скорее всего, потребует более инвазивных или ограниченных ресурсами контрмер или вмешательств (таких как МВ или моноклональные антитела), и поэтому должен получать ограниченную, но эффективную терапию, терапию с узким соотношением риска и пользы из-за побочных эффектов или более высокий уровень ухода, например, прием в отделение интенсивной терапии. В противоположность этому, пациент, который находится на более низком риске необходимости инвазивной кислородной терапии, может быть помещен в менее интенсивную обстановку ухода, такую как регулярное отделение, или даже освобожден от ЭД для продолжения самоконтроля в домашних условиях. ЭКЗАМ был разработан, чтобы помочь отбирать таких пациентов. 62 63 64 65 Обратите внимание, что модель на данный момент не одобрена ни одним регулирующим органом и должна использоваться только в исследовательских целях. Экзамен СКОК ЭКЗАМ был подготовлен с использованием FL; он выводит балл риска (так называемый балл ЭКЗАМ) похожий на CORISK (расширенные данные Фиг. ) and can be used in the same way to triage patients. It corresponds to a patient’s oxygen support requirements within two windows—24 and 72 h—after initial presentation to the ED. Extended Data Fig. иллюстрирует, как CORISK и результат экзамена могут быть использованы для сортировки пациентов. 27 9a 9б Изображения рентгеновских лучей грудной клетки были предварительно обработаны, чтобы выбрать изображение передней позиции и исключить изображения бокового изображения, а затем масштабированы до разрешения 224 × 224. , модель объединяет информацию из функций EMR и CXR (на основе модифицированного ResNet34 с пространственным вниманием) предварительно обученный на наборе данных CheXpert) and the Deep & Cross network Чтобы сблизить эти различные типы данных, из каждого изображения CXR был извлечен 512-мерный вектор функции с использованием предварительно обученного ResNet34, с пространственным вниманием, а затем соединен с функциями EMR в качестве ввода для сети Deep & Cross. . We used cross-entropy as the loss function and ‘Adam’ as the optimizer. The model was implemented in Tensorflow Настройка NVIDIA Clara Train SDK Средняя AUC для задач классификации (≥LFO, ≥HFO/NIV или ≥MV) была рассчитана и использована в качестве окончательной метрики оценки, с нормализацией до нулевой средней и единичной вариации. изображения CXR были предварительно обработаны для выбора правильной серии и исключения изображений бокового изображения, затем масштабированы до разрешения 224 × 224 (реф. ) 9а 66 67 68 9б 69 70 27 Функция импутирования и нормализации Алгоритм MissForest was used to impute EMR features, based on the local training dataset. If an EMR feature was completely missing from a client site dataset, the mean value of that feature, calculated exclusively on data from MGB client sites, was used. Then, EMR features were rescaled to zero-mean and unit variance based on statistics calculated on data from the MGB client sites. 71 Подробности слияния данных EMR-CXR с использованием сети Deep & Cross Для моделирования взаимодействия функций из данных EMR и CXR на уровне случая использовалась схема глубоких функций, основанная на архитектуре сети Deep & Cross. Бинарные и категорические характеристики для входов EMR, а также 512-мерные изображения в CXR были преобразованы в слияние плотных векторов реальных значений путем встраивания и сбора слоев. Трансформированные плотные векторы служили входом в рамку слияния, которая специально использовала перекрестную сеть для принуждения слияния между входами из разных источников. Перекрестная сеть выполняла явные перекрестки функций внутри своих слоев, проводя внутренние продукты между первоначальной функцией ввода и выходом из предыдущего слоя, тем самым увеличивая степень взаимодействия между функциями. В то же время, две отдельные классические глубокие нейронные сети с несколькими перекрестными, полностью подключенными слоями перекрестной связи были обучены. 68 ФЛ детали Пожалуй, наиболее устоявшейся формой ФЛ является реализация федеративного среднего алгоритма, предложенного Макмаханом и др. , or variations thereof. This algorithm can be realized using a client-server setup where each participating site acts as a client. One can think of FL as a method aiming to minimize a global loss function by reducing a set of local loss functions, which are estimated at each site. By minimizing each client site’s local loss while also synchronizing the learned client site weights on a centralized aggregation server, one can minimize global loss without needing to access the entire dataset in a centralized location. Each client site learns locally, and shares model weight updates with a central server that aggregates contributions using secure sockets layer encryption and communication protocols. The server then sends an updated set of weights to each client site after aggregation, and sites resume training locally. The server and client site iterate back and forth until the model converges (Extended Data Fig. ) 72 9С Псевдоалгоритм ФЛ показан в Дополнительной записке В наших экспериментах мы установили число федеративных раундов на = 200, with one local training epoch per round По количеству клиентов, по количеству клиентов, , был до 20 в зависимости от сетевой подключенности клиентов или доступных данных для конкретного целевого периода результатов (24 или 72 ч). , зависит от размера набора данных у каждого клиента и используется для взвешивания вкладов каждого клиента при агрегировании весов модели в федеративном среднем. Во время задания обучения FL каждый клиентский сайт выбирает свою лучшую локальную модель, отслеживая производительность модели на своем локальном наборе валидаций. В то же время сервер определяет лучшую глобальную модель на основе средних баллов валидации, отправленных с каждого клиентского сайта на сервер после каждого тура FL. После окончания обучения FL, лучшие локальные модели и лучшая глобальная модель автоматически делятся со всеми клиентскими сайтами и оцениваются на их локальных данных тестирования. 1 T t K НК k Оптимизатор Адама был использован как для местного обучения, так и для FL с начальной скоростью обучения 5 × 10–5 и постепенным распаданием скорости обучения с фактором 0,5 после каждых 40 эпох, что важно для сближения федеративных средних значений. Случайные аффинные трансформации, включая вращение, переводы, резки, масштабирование и шум и сдвиги случайной интенсивности, были применены к изображениям для увеличения данных во время тренировки. 73 Из-за чувствительности слоев BN при работе с различными клиентами в ненезависимой и идентично распределенной обстановке мы обнаружили, что наилучшие показатели модели были достигнуты при сохранении предварительно обученного ResNet34 с пространственным вниманием. параметры, фиксированные во время обучения FL (то есть с использованием скорости обучения нуля для этих слоев). сеть Deep & Cross, которая сочетает в себе функции изображения с функциями EMR, не содержит слоев BN и, следовательно, не пострадала от проблем нестабильности BN. 58 47 В этом исследовании мы исследовали схему сохранения конфиденциальности, которая делится только частичными обновлениями модели между сервером и клиентскими сайтами. Обновления веса были ранжированы во время каждой итерации по величине вклада, и только определенный процент крупнейших обновлений веса был совместно с сервером. t) (расширенные данные Фиг. ), which was computed from all non-zero gradients, Δ , и может быть разным для каждого клиента В каждом раунде Вариации этой схемы могут включать дополнительные отрезки больших градиентов или дифференциальные схемы конфиденциальности. которые добавляют случайный шум к градиентам или даже к сырым данным, прежде чем подавать их в сеть . k 5 ВК(т) k t 49 51 Статистический анализ Мы провели тест Wilcoxon Signed-Rank, чтобы подтвердить значимость наблюдаемого улучшения производительности между локально обученной моделью и моделью FL для 24-х и 72-х часовых точек (рис. Расширенный фиг данных. Нулевая гипотеза была отвергнута с односторонним «1 × 10–3 в обоих случаях. 2 1 P Корреляция Пирсона была использована для оценки обобщаемости (устойчивости среднего значения AUC к данным теста других клиентских сайтов) локально обученных моделей по отношению к соответствующему размеру локального набора данных. = 0,43 , = 0.035, градусов свободы (df) = 17 для 24-часовой модели и 0 0 62 , = 0,003, df = 16 для модели 72-h).Это указывает на то, что размер набора данных не является единственным фактором, определяющим устойчивость модели к невидимым данным. r P r P Для сравнения кривых ROC от глобальной модели FL и локальных моделей, обученных на разных площадках (расширенные данные. ), мы запустили 1000 образцов из данных и вычислили полученные AUC. Мы затем рассчитали разницу между двумя сериями и стандартизировали с помощью формулы = (AUC1 – AUC2)/ Где Это стандартная разница, является стандартным отклонением различий bootstrap, а AUC1 и AUC2 являются соответствующими сериями AUC bootstrapped. При нормальном распределении мы получаем значения, иллюстрированные в дополнительной таблице Результаты показывают, что нулевая гипотеза была отвергнута с очень низким значения, указывающие на статистическую значимость превосходства результатов ФЛ. Расчет значения были проведены в R с библиотекой pROC . 3 D s D s D P 2 P P 74 Поскольку модель предсказывает дискретный результат, непрерывный балл от 0 до 1, простой калибровный анализ, такой как qqplot, невозможен. Мы провели односторонний анализ вариации (ANOVA) тестов для сравнения местных и FL модельных баллов между четырьмя категориями наземной истины (RA, LFO, HFO, MV). Статистическая, рассчитанная как вариация между образцами, разделенная на вариацию внутри образцов и представляющая степень дисперсии между различными группами, была использована для количественного определения моделей. -значения пяти различных локальных сайтов составляют 245.7, 253.4, 342.3, 389.8 и 634.8, в то время как для модели FL это 843.5. -значения означают, что группы более разделены, баллы из нашей модели FL явно показывают большую дисперсию между четырьмя категориями фундаментальной истины. значение теста ANOVA на модели FL <2 × 10–16, что указывает на то, что результаты прогнозирования FL статистически существенно отличаются между различными классами прогнозирования. 10 F F F P Репортаж Резюме Дополнительная информация по исследовательскому проекту доступна в Связано с этой статьей. Резюме Nature Research Reporting Доступность данных Данные из 20 институтов, участвовавших в этом исследовании, остаются под их контролем. Эти данные были использованы для обучения на каждом из местных сайтов и не были переданы ни одному из других участвующих учреждений или с федеративным сервером, и они не являются общедоступными. Данные из независимых сайтов валидации поддерживаются CAMCA, и доступ может быть запрошен, обратившись к Q.L. На основании определения CAMCA, обзор обмена данными и изменение IRB для исследовательских целей может быть проведено исследовательской администрацией MGB и в соответствии с МГБ IRB и политикой. Код доступности Все код и программное обеспечение, используемые в этом исследовании, общедоступны в NGC. Чтобы получить доступ, войти в систему в качестве гостя или создать профиль, введите один из URL-адресов ниже. : → Программное обеспечение федеративного обучения доступно в рамках Clara Train SDK: В качестве альтернативы, используйте эту команду для загрузки модели «wget --content-disposition» -О clara_train_covid19_exam_ehr_xray_1.zip». 61 https://ngc.nvidia.com/catalog/models/nvidia:med:clara_train_covid19_exam_ehr_xray https://ngc.nvidia.com/catalog/containers/nvidia:clara-train-sdk https://api.ngc.nvidia.com/v2/models/nvidia/med/clara_train_covid19_exam_ehr_xray/versions/1/zip Референции Budd, J. et al. Digital technologies in the public-health response to COVID-19. , 1183–1192 (2020). Nat. Med. 26 Moorthy, V., Henao Restrepo, A. M., Preziosi, M.-P. & Swaminathan, S. Data sharing for novel coronavirus (COVID-19). , 150 (2020). Bull. World Health Organ. 98 Chen, Q., Allot, A. & Lu, Z. Keep up with the latest coronavirus research. , 193 (2020). Nature 579 Fabbri, F., Bhatia, A., Mayer, A., Schlotter, B. & Kaiser, J. BCG IT spend pulse: how COVID-19 is shifting tech priorities. (2020). https://www.bcg.com/publications/2020/how-covid-19-is-shifting-big-it-spend Candelon, F., Reichert, T., Duranton, S., di Carlo, R. C. & De Bondt, M. The rise of the AI-powered company in the postcrisis world. (2020). https://www.bcg.com/en-gb/publications/2020/business-applications-artificial-intelligence-post-covid Chao, H. et al. Integrative analysis for COVID-19 patient outcome prediction. , 101844 (2021). Med. Image Anal. 67 Zhu, X. et al. Joint prediction and time estimation of COVID-19 developing severe symptoms using chest CT scan. , 101824 (2021). Med. Image Anal. 67 Yang, D. et al. Federated semi-supervised learning for Covid region segmentation in chest ct using multi-national data from China, Italy, Japan. , 101992 (2021). Med. Image Anal. 70 Minaee, S., Kafieh, R., Sonka, M., Yazdani, S. & Jamalipour Soufi, G. Deep-COVID: predicting COVID-19 from chest X-ray images using deep transfer learning. , 101794 (2020). Med. Image Anal. 65 COVID-19 Studies from the World Health Organization Database. (2020). https://clinicaltrials.gov/ct2/who_table ACTIV. (2020). https://www.nih.gov/research-training/medical-research-initiatives/activ Coronavirus Treatment Acceleration Program (CTAP). US Food and Drug Administration (2020). https://www.fda.gov/drugs/coronavirus-covid-19-drugs/coronavirus-treatment-acceleration-program-ctap Gleeson, P., Davison, A. P., Silver, R. A. & Ascoli, G. A. A commitment to open source in neuroscience. , 964–965 (2017). Neuron 96 Piwowar, H. et al. The state of OA: a large-scale analysis of the prevalence and impact of open access articles. , e4375 (2018). PeerJ. 6 European Society of Radiology (ESR). What the radiologist should know about artificial intelligence – an ESR white paper. , 44 (2019). Insights Imaging 10 Pesapane, F., Codari, M. & Sardanelli, F. Artificial intelligence in medical imaging: threat or opportunity? Radiologists again at the forefront of innovation in medicine. , 35 (2018). Eur. Radiol. Exp. 2 Price, W. N. 2nd & Cohen, I. G. Privacy in the age of medical big data. , 37–43 (2019). Nat. Med. 25 Liang, W. et al. Development and validation of a clinical risk score to predict the occurrence of critical illness in hospitalized patients with COVID-19. , 1081–1089 (2020). JAMA Intern. Med. 180 Wynants, L. et al. Prediction models for diagnosis and prognosis of covid-19 infection: systematic review and critical appraisal. , m1328 (2020). Brit. Med. J. 369 Zhang, L. et al. D-dimer levels on admission to predict in-hospital mortality in patients with Covid-19. , 1324–1329 (2020). J. Thromb. Haemost. 18 Sands, K. E. et al. Patient characteristics and admitting vital signs associated with coronavirus disease 2019 (COVID-19)-related mortality among patients admitted with noncritical illness. (2020). https://doi.org/10.1017/ice.2020.461 American College of Radiology. CR recommendations for the use of chest radiography and computed tomography (CT) for suspected COVID-19 infection. (2020). https://www.acr.org/Advocacy-and-Economics/ACR-Position-Statements/Recommendations-for-Chest-Radiography-and-CT-for-Suspected-COVID19-Infection Rubin, G. D. et al. The role of chest imaging in patient management during the COVID-19 pandemic: a multinational consensus statement from the Fleischner Society. , 172–180 (2020). Radiology 296 World Health Organization. Use of chest imaging in COVID-19. (2020). https://www.who.int/publications/i/item/use-of-chest-imaging-in-covid-19 Jamil, S. et al. Diagnosis and management of COVID-19 disease. , 10 (2020). Am. J. Respir. Crit. Care Med. 201 Redmond, C. E., Nicolaou, S., Berger, F. H., Sheikh, A. M. & Patlas, M. N. Emergency radiology during the COVID-19 pandemic: The Canadian Association of Radiologists Recommendations for Practice. , 425–430 (2020). Can. Assoc. Radiologists J. 71 Buch, V. et al. Development and validation of a deep learning model for prediction of severe outcomes in suspected COVID-19 Infection. Preprint at (2021). https://arxiv.org/abs/2103.11269 Lyons, C. & Callaghan, M. The use of high-flow nasal oxygen in COVID-19. , 843–847 (2020). Anaesthesia 75 Whittle, J. S., Pavlov, I., Sacchetti, A. D., Atwood, C. & Rosenberg, M. S. Respiratory support for adult patients with COVID-19. , 95–101 (2020). J. Am. Coll. Emerg. Physicians Open 1 Ai, J., Li, Y., Zhou, X. & Zhang, W. COVID-19: treating and managing severe cases. , 370–371 (2020). Cell Res. 30 Esteva, A. et al. A guide to deep learning in healthcare. , 24–29 (2019). Nat. Med. 25 Cahan, E. M., Hernandez-Boussard, T., Thadaney-Israni, S. & Rubin, D. L. Putting the data before the algorithm in big data addressing personalized healthcare. , 78 (2019). NPJ Digit. Med. 2 Thrall, J. H. et al. Artificial intelligence and machine learning in radiology: opportunities, challenges, pitfalls, and criteria for success. , 504–508 (2018). J. Am. Coll. Radiol. 15 Shilo, S., Rossman, H. & Segal, E. Axes of a revolution: challenges and promises of big data in healthcare. , 29–38 (2020). Nat. Med. 26 Gao, Y. & Cui, Y. Deep transfer learning for reducing health care disparities arising from biomedical data inequality. , 5131 (2020). Nat. Commun. 11 Rieke, N. et al. The future of digital health with federated learning. , 119 (2020). NPJ Dig. Med. 3 Yang, Q., Liu, Y., Chen, T. & Tong, Y. Federated machine learning: concept and applications. , 12 (2019). ACM Trans. Intell. Syst. Technol. 10 Ma, C. et al. On safeguarding privacy and security in the framework of federated learning. , 242–248 (2020). IEEE Netw. 34 Brisimi, T. S. et al. Federated learning of predictive models from federated Electronic Health Records. , 59–67 (2018). Int. J. Med. Inform. 112 Roth, H. R. et al. Federated learning for breast density classification: a real-world implementation. In , (eds. Albarqouni, S. et al.) Vol. 12,444, 181–191 (Springer International Publishing, 2020). Proc. Second MICCAI Workshop, DART 2020 and First MICCAI Workshop, DCL 2020 Domain Adaptation and Representation Transfer, and Distributed and Collaborative Learning Sheller, M. J. et al. Federated learning in medicine: facilitating multi-institutional collaborations without sharing patient data. , 12598 (2020). Sci. Rep. 10 Remedios, S. W., Butman, J. A., Landman, B. A. & Pham, D. L. in (eds Remedios, S. W. et al.) (Springer, 2020). Federated Gradient Averaging for Multi-Site Training with Momentum-Based Optimizers Xu, Y. et al. A collaborative online AI engine for CT-based COVID-19 diagnosis. Preprint at (2020). https://www.medrxiv.org/content/10.1101/2020.05.10.20096073v2 Raisaro, J. L. et al. SCOR: A secure international informatics infrastructure to investigate COVID-19. , 1721–1726 (2020). J. Am. Med. Inform. Assoc. 27 Vaid, A. et al. Federated learning of electronic health records to improve mortality prediction in hospitalized patients with COVID-19: machine learning approach. , e24207 (2021). JMIR Med. Inform. 9 Nino, G. et al. Pediatric lung imaging features of COVID-19: a systematic review and meta-analysis. , 252–263 (2021). Pediatr. Pulmonol. 56 Fredrikson, M., Jha, S. & Ristenpart, T. Model inversion attacks that exploit confidence information and basic countermeasures. In 1322–1333, (2015). Proc. 22nd ACM SIGSAC Conference on Computer and Communications Security https://doi.org/10.1145/2810103.2813677 Zhu, L., Liu, Z. & Han, S. in (eds Wallach, H. et al.) 14774–14784 (Curran Associates, Inc., 2019). Advances in Neural Information Processing Systems 32 Kaissis, G. A., Makowski, M. R., Rückert, D. & Braren, R. F. Secure, privacy-preserving and federated machine learning in medical imaging. , 305–311 (2020). Nat. Mach. Intell. 2 Li, W. et al. in 133–141 (Springer, 2019). Privacy-Preserving Federated Brain Tumour Segmentation Shokri, R. & Shmatikov, V. Privacy-preserving deep learning. In (2015). Proc. 53rd Annual Allerton Conference on Communication, Control, and Computing (Allerton) https://doi.org/10.1109/allerton.2015.7447103 Li, X. et al. Multi-site fMRI analysis using privacy-preserving federated learning and domain adaptation: ABIDE results. , 101765 (2020). Med. Image Anal. 65 Estiri, H. et al. Predicting COVID-19 mortality with electronic medical records. , 15 (2021). NPJ Dig. Med. 4 Jiang, G. et al. Harmonization of detailed clinical models with clinical study data standards. , 65–74 (2015). Methods Inf. Med. 54 Yang, D. et al. in . (2019). Searching Learning Strategy with Reinforcement Learning for 3D Medical Image Segmentation https://doi.org/10.1007/978-3-030-32245-8_1 Elsken, T., Metzen, J. H. & Hutter, F. Neural architecture search: a survey. , 1–21 (2019). J. Mach. Learning Res. 20 Yao, Q. et al. Taking human out of learning applications: a survey on automated machine learning. Preprint at (2019). https://arxiv.org/abs/1810.13306 Ioffe, S. & Szegedy, C. Batch normalization: accelerating deep network training by reducing internal covariate shift. In , PMLR , 448–456 (2015). Proc. 32nd International Conf. Machine Learning 37 Kaufman, S., Rosset, S. & Perlich, C. Leakage in data mining: formulation, detection, and avoidance. In , 556–563 (2011). Proc. 17th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining Zhang, C. et al. BatchCrypt: efficient homomorphic encryption for cross-silo federated learning. In , 493–506 (2020). Proc. 2020 USENIX Annual Technical Conference, ATC 2020 . (2020). Nvidia NGC Catalog: COVID-19 Related Models https://ngc.nvidia.com/catalog/models?orderBy=scoreDESC&pageNumber=0&query=covid&quickFilter=models&filters Marini, J. J. & Gattinoni, L. Management of COVID-19 respiratory distress. , 2329–2330 (2020). JAMA 323 Cook, T. M. et al. Consensus guidelines for managing the airway in patients with COVID-19: Guidelines from the Difficult Airway Society, the Association of Anaesthetists the Intensive Care Society, the Faculty of Intensive Care Medicine and the Royal College of Anaesthetist. , 785–799 (2020). Anaesthesia 75 Galloway, J. B. et al. A clinical risk score to identify patients with COVID-19 at high risk of critical care admission or death: an observational cohort study. , 282–288 (2020). J. Infect. 81 Kilaru, A. S. et al. Return hospital admissions among 1419 COVID-19 patients discharged from five U.S. emergency departments. , 1039–1042 (2020). Acad. Emerg. Med. 27 He, K., Zhang, X., Ren, S. & Sun, J. Deep residual learning for image recognition. In (2016). Proc. 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR) https://doi.org/10.1109/cvpr.2016.90 Irvin, J. et al. CheXpert: a large chest radiograph dataset with uncertainty labels and expert comparison. , 590–597 (2019). Proc. AAAI Conf. Artif. Intell. 33 Wang, R., Fu, B., Fu, G. & Wang, M. Deep & Cross network for Ad Click predictions. In Article no. 12 (2017). Proc. ADKDD’17 Abadi, M. et al. TensorFlow: asystem for large-scale machine learning. In , USENIX Association 265–283 (2016). 12th USENIX Symposium on Operating Systems Design and Implementation (OSDI 16) . (2020). NVIDIA Clara Imaging https://developer.nvidia.com/clara-medical-imaging Stekhoven, D. J. & Bühlmann, P. MissForest–non-parametric missing value imputation for mixed-type data. , 112–118 (2012). Bioinformatics 28 McMahan, H., Moore, E., Ramage, D., Hampson, S. & y Arcas, B. A. Communication-efficient learning of deep networks from decentralized data. (2017). http://proceedings.mlr.press/v54/mcmahan17a.html Hsieh, K., Phanishayee, A., Mutlu, O. & Gibbons, P. B. The non-IID data quagmire of decentralized machine learning. In PMLR 119 (2020). Proc. 37th International Conf. Machine Learning Robin, X. et al. pROC: an open-source package for R and S+ to analyze and compare ROC curves. , 77 (2011). BMC Bioinformatics 12 Признания МГБ благодарит следующих лиц за поддержку: J. Brink, Департамент радиологии, Массачусетская общая больница, Гарвардская медицинская школа, Бостон, MA; N. Guo, Центр передовых медицинских вычислений и анализа, Департамент радиологии, Массачусетская общая больница, Гарвардская общая медицинская школа, Гарвардская медицинская школа, Бостон, MA; N. Neumark, Центр исследований клинических данных, Массачусетская общая Бригам, Бостон, MA; T. Schultz, Департамент радиологии, Массачусетская общая больница, Бостон, MA; N. Guo, Центр передовых медицинских вычислений и анализа, Департамент радиологии, Массачусетская общая боль Через Медицинский факультет, Чулалонгкорнский университет поблагодарил Ратчапаписек Сомпоч Фонд грантов RA (PO) (номер 001/63) за сбор и управление клинических данных и биологических образцов, связанных с COVID-19 для исследовательской рабочей группы, факультета медицины, Чулалонгкорнского университета. Центр биомедицинских исследований NIHR в Кембридже поблагодарил A. Priest, который поддерживается NIHR (Cambridge Biomedical Research Centre at Cambridge University Hospitals NHS Foundation Trust). National Taiwan University MeDA Lab и MAHC и Taiwan National Health Insurance Administration поблагодарили MOST Joint Research Center for AI technology, All Vista Healthcare National Health Administration, Taiwan, Министерство науки и технологий, и Taiwan National Center for Theoretical Sci https://data.ucsf.edu/covid19 Эта статья доступна на природе под лицензией CC by 4.0 Deed (Attribution 4.0 International). Эта статья доступна на природе под лицензией CC by 4.0 Deed (Attribution 4.0 International).