إمكانيات الذكاء الاصطناعي الجديدة تستطيع تحديد شدة COVID باستخدام أشعة X وأرقام طبية

المؤلفين : إيتا ديانا هولج ر.روث Aoxiao Zhong احمد هارون Amilcare Gentili Anas Z. Abidin Andrew Liu Anthony Beardsworth Costa Bradford J. وود Chien-Sung Tsai Chih-Hung Wang Chun-Nan Hsu C. K. Lee رومانسي روي دجلة Xu دافن Wu Eddie Huang Felipe Campos Kitamura غريفيان ليسي Gustavo César de Antônio Corradi Gustavo Nino Hao-Hsin Shin Hirofumi Obinata Hui Ren Jason C. Crane Jesse Tetreault Jiahui Guan John W. Garrett Joshua D. Kaggie Jung Gil Park Keith Dreyer Krishna Juluru Kristopher Kersten Marcio Aloisio Bezerra Cavalcanti Rockenbach Marius George Linguraru Masoom A. Haider Meena AbdelMaseeh Nicola Rieke Pablo F. Damasceno Pedro Mario Cruz e Silva Pochuan Wang Sheng Xu Shuichi Kawano Sira Sriswasdi Soo Young Park Thomas M. Grist Varun Buch Watsamon Jantarabenjakul Weichung Wang Won Young Tak Xiang Li Xihong Lin Young Joon Kwon Abood Quraini Andrew Feng Andrew N. Priest Baris Turkbey Benjamin Glicksberg Bernardo Bizzo Byung Seok Kim Carlos Tor-Díez Chia-Cheng Lee Chia-Jung Hsu Chin Lin Chiu-Ling Lai Christopher P. Hess Colin Compas Deepeksha Bhatia Eric K. Oermann Evan Leibovitz Hisashi Sasaki Hitoshi Mori Isaac Yang Jae Ho Sohn Krishna Nand Keshava Murthy Li-Chen Fu Matheus Ribeiro Furtado de Mendonça Mike Fralick Min Kyu Kang Mohammad Adil Natalie Gangai Peerapon Vateekul Pierre Elnajjar Sarah Hickman Sharmila Majumdar Shelley L. McLeod Sheridan Reed Stefan Gräf Stephanie Harmon Tatsuya Kodama Thanyawee Puthanakit Tony Mazzulli Vitor Lima de Lavor Yothin Rakvongthai Yu Rim Lee Yuhong Wen Fiona J. Gilbert Mona G. Flores Quanzheng Li المؤلفين : إيتا ديانا هولج ر.روث Aoxiao زونغ احمد هارون مريم العذراء Anas Z. أوبيدين أندريه لوي Anthony Beardsworth كوستا Bradford J. وود تامر حسني تشي هونغ واينغ شون-ان هان C. K. لي رومانسي روي دجلة Xu دافن Wu أودي هانغ فيليب كامبو Kitamura غريفيان ليسي جورج كاسار من أنطونيو كورودي غوتو نينو شيرين شيرين Hirofumi Obinata هاني رين جاكسون C. كريين جيسي تيتريوت جاواو جيان جون W. جارت جوشوا د.كاغجي حديقة جونغ جيل كيتش Dreyer كريستيان جورج كريستيان كريستيان Marcio Aloisio Bezerra Cavalcanti روكنابا ماريوس جورج لينغورو ميتسوبيشي A. Haider محمد عبد الحميد نيكولا ريتش بوليف F. Damasceno ماريو كروز وسيلفا تامر حسني شينجو سو Shuichi Kawano السيدة زينب حديقة Soo Young توماس M. غريست كتاب Varun عطلة عيد الفطر زعيم Wang نانسي نانسي شينغ لي يانغ لين الشاب جوون كون كريم كريم أندريه فينغ أندرو نورد برشلونة Turkbey بنغازي غليكسبرغ برناردو بيزوس كيم كيم كيم كارلوس تور ديز شيا-شينغ لي شياو جونغ Hsu الصين لين تشوينغ لوي كريستوفر P. هاس كولين كامب ديبيكا بوتيا إريك ك. أورمان إيفان ليفوفيتش هاساشي ساسكي هيتش موري إسحاق يان جاي هو ابن كريستينا ناند كشفا مارثي كين كين ماتيس روبيرو Furtado de Mendonça مايك فرانكلين ميني كو كونغ محمد صالح ناتالي غاندي فورين بوليسي بيتر إليناير سارة هيتمان شيرين ميخائيل شيللي L. ماكلود شيرين Reed ستيفن غريفيه ستيفاني هارمون تاتسيو كوداما تامر حسني توني مزيلي فيتور ليما من العمل ياسر ياسر Yu Rim لي يانغ يانغ Fiona J. غيلبرت Mona G. Flores كوينز لي abstract وقد استخدمنا هذه البيانات من 20 معهد في جميع أنحاء العالم للتدريب على نموذج FL ، والذي يسمى EXAM (المعرض الطبي الإلكتروني (EMR) X-ray AI نموذج) ، والذي يقدم توقعات متوقعة حول متطلبات الأكسجين المستقبلية للمرضى المصابين بفيروس COVID-19 باستخدام الدخولات من العلامات الحيوية ، والبيانات المختبرية ، والرياضيات X-rays. EXAM حصل على مساحة متوسطية تحت الصفا (AUC) >0.92 لتوضيح النتائج في 24 و 72 ساعة من وقت تقديمها الأول إلى غرفة الطوارئ ، ويقدم 16٪ تحسينًا في متوسط AUC المقياس على جميع المواقع المشاركة ، وزيادة متوسطية التكوين في 38٪ مقارنة مع النماذج الم Main وتجمع المجتمعات العلمية والكلياتية والطبية والعلوم البيولوجية في مواجهة أزمة كويدو-19 للقياس بسرعة النماذج الجديدة في الذكاء الاصطناعي (أو الذكاء الاصطناعي) التي هي سريعة وآمنة، ويمكنها تشجيع تبادل البيانات وتدريب وتشخيص النماذج دون الحواجز المعتادة في خصوصية البيانات وحقوق البيانات من التعاون التقليدي. , وبدأت شركات الرعاية الصحية والباحثين والمصانع تركز على التغلب على الاحتياجات السريرية المفقودة والمهمة التي خلقتها الأزمة، مع النتائج الرائعة. , , , , , , وقد تم تسريع استخدام الاختبارات السريرية وتسهيلها من قبل الهيئات التنظيمية الوطنية والروح التعاونية الدولية. , , وقد حثت تقنيات تحليل البيانات وتكنولوجيا الذكاء الاصطناعي دائمًا على اتخاذ نهجًا مفتوحًا ومشاركًا، بما في ذلك المفاتيح مفتوحة المصدر، والبحوث المتعددة، والمخزونات البيانية، والتوفر على مجموعات البيانات المفضلة بشكل عام. , وقد أكدت الفيروسات على الحاجة إلى إجراء تعاونات بيانات سريعة تتيح للمجتمعات السريرية والعلومية القدرة على الاستجابة إلى التحديات العالمية المتطورة والمتوسطة بسرعة. , , . 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 وقد تم تطوير نموذج CDS هذا في Mass General Brigham (MGB) وقد تم تحديده عبر بيانات العديد من أنظمة الرعاية الصحية.لقد تم تحديد نموذج CDS السابق على نموذج SARS-COV-2 المعتمد على الذكاء الاصطناعي، والعلامات الحيوية، والبيانات الديموغرافية والبيانات المختبرية التي أظهرت في المجلات السابقة أنها قد تؤدي إلى نتائج المرضى مع COVID-19. , , , تم اختيار CXR كدخول التصوير لأنها متاحة على نطاق واسع وتشير بشكل عام إلى الإرشادات مثل تلك التي توفرها ACR. شركة Fleischner , the WHO المجتمعات الوطنية اللاتينية , وزارة الصحة الوطنية COVID نصائح وشركات الإشعاع في جميع أنحاء العالم . The output of the CDS model was a score, termed CORISK وهذا يتوافق مع متطلبات دعم الأكسجين ويمكن أن تساعد في تحليل المرضى من قبل العلماء في الخط الأمامي. , , من المعروف أن شركات الرعاية الصحية ترغب في النماذج التي تم تحديدها على البيانات الخاصة بها. حتى الآن، تم تدريب معظم نموذجات الذكاء الاصطناعي، بما في ذلك نموذج CDS المذكور أعلاه، وتقييمها على البيانات "الخفية" التي غالبا ما تفتقر إلى التنوع. , ويمكن أن يؤدي ذلك إلى تشديد التكلفة وتخفيض الإنتاجية، وهذا يمكن تقليله من خلال التدريب على بيانات متنوعة من مواقع متعددة دون تركيز البيانات. استخدام أساليب مثل تعلم التحويل , FL هو طريقة تستخدم لتدريب نموذجات الذكاء الاصطناعي على مصادر بيانات مختلفة، دون نقل البيانات أو إظهارها خارج مكانها الأصلي. . 18 19 20 21 22 23 24 25 26 27 28 29 30 27 31 32 33 34 35 36 تدعم التعلم المشترك إطلاقاً سريعاً من التجارب المصممة بمركزية مع تحسين إتقان البيانات وتقييم التغييرات الفلكية والتأثير. يتم إرسال نموذج "لا يتدرب" إلى الموردين الآخرين ("الصندوقات") الذين يقومون بتنفيذ مهام تدريبية جزئية ، مع إرسال النتائج مرة أخرى لإدماجها في المورد المركزي ("الصندوقية"). . 37 36 يتم الحفاظ على إدارة البيانات لـ FL على المستوى المحلي، مما يقلل من التحديات التي تواجه الخصوصية، حيث يتم التواصل بين المواقع المملوكة والمورد المشترك فقط مع تقييمات النماذج أو التقييمات. , FL قد أثبتت بالفعل القوة في تطبيقات التصوير الطبية الحديثة , , , تحليل COVID-19 , , مثال ناشئ هو نموذج التوقعات عن الوفاة في المرضى المصابين بـ SARS-COV-2 الذي يستخدم الميزات السريرية، على الرغم من قيودها على عدد الطرق والمعدلات. . 38 39 40 41 42 43 8 44 45 46 وكان هدفنا هو تطوير نموذجًا قويًا ومحددًا يمكن أن يساعد في اختبار المرضى. أعتقد أن نموذج CDS يمكن أن يتم تصنيعًا ناجحًا، نظراً لأن استخدامه يستخدم إطارات البيانات المشتركة بشكل متزايد في الممارسة السريرية، ولأنها لا تعتمد بشكل كبير على تقييمات المستخدم المرتبطة بالمرض (مثل الإثارة السريرية أو الأعراض المذكورة). بدلاً من ذلك، تم استخدام النتائج المختبرية، علامات حيوية، دراسة التصوير الإبداعي، والبيانات الديمغرافية المكتوبة (أي العمر)، وبالتالي، نجحنا في إعادة تقييم نموذج CDS مع بيانات متنوعة باستخدام نهج FL الم كانت فكرةنا هي أن EXAM سوف تعمل أفضل من النماذج المحلية وسوف تجميع أفضل في جميع أنحاء أنظمة الرعاية الصحية. Results تصميم نموذج Exam يعتمد نموذج EXAM على نموذج CDS المذكور أعلاه. وقد تم استخدام 20 ميزة (19 من EMR و 1 من CXR) كدخول إلى النماذج. تم تخصيص علامات النتائج (أي "الواقع الجغرافي") بناءً على علاج المريض بالأكسجين بعد فترة من 24 و 72 ساعة من الإدخال الأولي إلى قسم الطوارئ (ED). . 27 1 تم تعيين علامات النتائج للمرضى إلى 0،0،25،0،50 و0،75 اعتمادًا على العلاج الأكثر تعقيدًا بالأكسجين التي حصلت على المريض في نافذة التوقيت. تم تعيين علامات العلاج بالأكسجين، على سبيل المثال، إلى الهواء المحلي (RA)، إلى الأكسجين منخفض التوقيت (LFO)، إلى الأكسجين منخفض التوقيت (HFO)/الخلايا الجاذبة (NIV) أو إلى الخلايا الميكانيكية (MV). إذا توفيت المريض في نافذة التوقيت، تم تعيين علامات النتائج إلى 1 . بالنسبة إلى ميزات EMR ، تم استخدام القيمة الأولى فقط التي تم تسجيلها في ED ، وتشمل إعادة تقييم البيانات إعادة تقييم ، وإعادة تقييم القيمة المفقودة ، وإعادة تقييم إلى متوسط صفر ومعدل واحد. وبالتالي فإن النموذج يدمج المعلومات من كل من ميزات EMR و CXR ، باستخدام الشبكة العصبية التجميلية 34 طبقاً (ResNet34) لإزالة ميزات من CXR و Deep & Cross لإزالة ميزات مع ميزات EMR (للمزيد من التفاصيل ، انظر: إن النتيجة النموذجية هي النتيجة المخاطرة، والتي تسمى النتيجة EXAM، وهي قيمة مستمرة في نطاق 0-1 لكل من توقعات 24 ساعة و72 ساعة تتوافق مع العلامات المذكورة أعلاه. الطرق التعاون مع النموذج تم تدريب نموذج EXAM باستخدام مجموعة من 16.148 الحالات ، مما يجعلها ليس فقط من بين أول نموذج FL لـ COVID-19 ولكن أيضًا مشروع تطوير كبير ومختلف الكيانات في الذكاء الاصطناعي ذات الصلة بالصحة العصبية (الصور. لم يتم توازن البيانات بين المواقع قبل استخراجها، وبحسب الظروف الحقيقية في علم الحاسوب السريرية، لم يتم تنفيذ توازن ملموس في إدخال البيانات من قبل المؤلفين. ) 1A ، B 1C ،D خريطة العالم التي تشير إلى 20 مواقع عمل مختلفة تشارك في دراسة EXAM. عدد القضايا التي تقدمها كل مؤسسة أو موقع (مستخدم 1 يمثل الموقع الذي يقدم أكبر عدد القضايا). توزيع ضغط X-ray في كل موقع للعميل. ، العمر المرضى في كل موقع العملاء ، مما يوضح العمر الأدنى والأقصى (الطائرات) ، العمر المتوسط (الطائرات) ، والانقسامات القياسية (الطائرات المزدوجة). . a b c d 1 وقد تم تقييم هذه التقييمات من قبل المختصين في المختصين في المختصين في المختصين في المختصين في المختصين في المختصين في المختصين في المختصين في المختصين. « 1 × 10–3, اختبار Wilcoxon المذكور) من 16٪ (على أساس متوسط AUC عند تشغيل النماذج على مجموعات الاختبار المحلية ذات الصلة: من 0.795 إلى 0.920, أو 12.5 نقطة مئوية) (الصور. وقد أدى ذلك أيضًا إلى تحسين 38 في المائة في الإشعاع (مما يحدده متوسط AUC عند تشغيل النماذج على جميع مجموعات الاختبار: من 0.667 إلى 0.920, أو 25.3 نقطة بالمائة) من أفضل النماذج العالمية لتوضيح معالجة الأكسجين لمدة 24 ساعة مقارنة مع النماذج التي تم تدريبها فقط على بيانات الموقع الخاصة (الصور. بالنسبة إلى النتائج المتوقعة من معالجة الأكسجين لمدة 72 ساعة ، فإن أفضل تدريب النماذج العالمية كان يؤدي إلى تحسينات متوسطية في الأداء بنسبة 18٪ مقارنة مع النماذج المدرسية المحلية ، في حين أن إحداثيات النماذج العالمية تحسن في المتوسط بنسبة 34٪ (البيانات المتوسطة. تم تحديد استقرار النتائج من خلال تكرار ثلاث دورات من التدريب المحلي وFL على فرق البيانات المسجلة المختلفة. P 2a 2B 1 , Performance on each client’s test set in prediction of 24-h oxygen treatment for models trained on local data only (Local) versus that of the best global model available on the server (FL (gl. best)). Av., average test performance across all sites. , عموماً (أداء المتوسط في بيانات اختبار المواقع الأخرى، كما هو موضح بـ AUC المتوسط) كجزء من حجم مجموعة البيانات للعميل (لا حالة).الخط الداخلي الخضري يؤكد عموماً عموماً عموماً أداء أفضل نموذج عالمي.تظهر النتائج للعميل 18 من 20 عميل، لأن عميل 12 كان قد حصل على النتائج فقط لـ 72 ساعة من الأكسجين (البيانات المتوسطة. في هذه الحالة، لم يكن هناك أي إشارة إلى أن المرضى الذين يعانون من اضطرابات نفسية (الإصابة بمرض التهاب الكبد) قد لا يكون لديهم أي إشارة في هذه الحالة. كما تم إلغاء البيانات للعميل 14 من الحسابات المتوسطة للضبط في النماذج المحلية. a b 1 الطرق تمكنت النماذج المحلية التي تم تدريبها باستخدام مجموعات غير متوازنة (على سبيل المثال، في معظم الحالات الصغيرة من COVID-19) من الاستفادة من نهج FL، مع تحسين كبير في أداء متوسط AUC التوقيت لأصناف مع القليل فقط من الحالات. هذا كان واضحًا في موقع العملاء 16 (مجموعة البيانات غير متوازنة) ، مع معظم المرضى الذين يعانون من شدة مرض صغير مع قليل من الحالات الصعبة فقط. اكسسوارات البيانات المرتفعة. وأهم من ذلك، فقد ارتفعت عمق نمو النماذج FL بشكل كبير عن النماذج المدرسية المحلية. 3a 2 ، ROC في موقع المستخدم 16 ، مع البيانات غير متوازنة وأكثر من ذلك بكثير الحالات الخفيفة. ويُعدّ نموذج (ROC) من نموذج (ROC) من نموذج (ROC) من نموذج (ROC) من نموذج (ROC) من نموذج (ROC) من نموذج (ROC) من نموذج (ROC) من نموذج (ROC) من نموذج (ROC) من نموذج (ROC) من نموذج (ROC) من نموذج (ROC) من نموذج (ROC) من نموذج (ROC) من نموذج (ROC) من نموذج ( ) of the EXAM risk score are shown. Pos and neg denote the number of positive and negative cases, respectively, as defined by this range of EXAM score. a b t In the case of client sites with relatively small datasets, the best FL model markedly outperformed not only the local model but also those trained on larger datasets from five client sites in the Boston area of the USA (Fig. ) 3B وقد عمل النموذج العالمي بشكل جيد في توقع احتياجات الأكسجين في 24/72 ساعة في المرضى جميعا COVID إيجابية ونيك (البيانات المتوسطة الصورة. ). 3 التحكم في المواقع المستقلة Following initial training, EXAM was subsequently tested at three independent validation sites: Cooley Dickinson Hospital (CDH), Martha’s Vineyard Hospital (MVH) and Nantucket Cottage Hospital (NCH), all in Massachusetts, USA. The model was not retrained at these sites and it was used only for validation purposes. The cohort size and model inference results are summarized in Table , and the ROC curves and confusion matrices for the largest dataset (from CDH) are shown in Fig. تم إعداد نقطة العمل لتمييز بين التخزين غير الميكانيكي والتخزين الميكانيكي (MV) المعالجة (أو الموت).معدل FL عالمي التدريب، EXAM، حصل على متوسط AUC من 0.944 و 0.924 لمهام التخزين 24 و 72 ساعة، على التوالي. وفيما يتعلق بتوقيت علاج MV (أو الموت) في 24 ساعة، حصلت EXAM على حساسية 0.950 و حساسية 0.882 في CDH، و حساسية 1.000 و حساسية 0.934 في MVH. لم يكن لدى NCH أي حالات مع MV / الموت في 24 ساعة فيما يتعلق بتوقيت MV 72 ساعة، حصلت EXAM على حساسية 0.929 و حساسية 0.880 في CDH، حساسية 1.000 و حساسية 0.976 في MVH و حساسية 1.000 و حساسية 0.929 في NCH. 2 4 2 , , Performance (ROC) (top) and confusion matrices (bottom) of the EXAM FL model on the CDH dataset for prediction of oxygen requirement at 24 h ( ( 24 ساعة ) (بعد ثلاثة أسابيع من إجمالي أسعار الوقود) ) من أرقام المخاطر في الاختبار. a b a b t For MV at CDH at 72 h, EXAM had a low false-negative rate of 7.1%. Representative failure cases are presented in Extended Data Fig. , showing two false-negative cases from CDH where one case had many missing EMR data features and the other had a CXR with a motion artifact and some missing EMR features. 4 استخدام الخصوصية التمييزية A primary motivation for healthcare institutes to use FL is to preserve the security and privacy of their data, as well as adherence to data compliance measures. For FL, there remains the potential risk of model ‘inversion’ أو حتى إعادة بناء الصور التدريبية من الخلفيات النموذجية نفسها . To counter these risks, security-enhancing measures were used to mitigate risk in the event of data ‘interception’ during site-server communication . We experimented with techniques to avoid interception of FL data, and added a security feature that we believe could encourage more institutions to use FL. We thus validated previous findings showing that partial weight sharing, and other differential privacy techniques, can successfully be applied in FL من خلال التحقيق في نظام تقسيم الوزن الجزئي , , أظهرت أن النماذج يمكن أن تصل إلى أداء مقارنة حتى عندما يتم مشاركة 25% فقط من تحديثات الوزن (البيانات المتوسطة. ). 47 48 49 50 50 51 52 5 نقاش This study features a large, real-world healthcare FL study in terms of number of sites and number of data points used. We believe that it provides a powerful proof-of-concept of the feasibility of using FL for fast and collaborative development of needed AI models in healthcare. Our study involved multiple sites across four continents and under the oversight of different regulatory bodies, and thus holds the promise of being provided to different regulated markets in an expedited way. The global FL model, EXAM, proved to be more robust and achieved better results at individual sites than any model trained on only local data. We believe that consistent improvement was achieved owing to a larger, but also a more diverse, dataset, the use of data inputs that can be standardized and avoidance of clinical impressions/reported symptoms. These factors played an important part in increasing the benefits from this FL approach and its impact on performance, generalizability and, ultimately, the model’s usability. For a client site with a relatively small dataset, two typical approaches could be used for fitting a useful model: one is to train locally with its own data, the other is to apply a model trained on a larger dataset. For sites with small datasets, it would have been virtually impossible to build a performant deep learning model using only their local data. The finding, that these two approaches were outperformed on all three prediction tasks by the global FL model, indicates that the benefit for client sites with small datasets arising from participation in FL collaborations is substantial. This is probaby a reflection of FL’s ability to capture more diversity than local training, and to mitigate the bias present in models trained on a homogenous population. An under-represented population or age group in one hospital/region might be highly represented in another region—such as children who might be differentially affected by COVID-19, including disease manifestations in lung imaging . 46 وتؤكد النتائج الإجمالية أن النموذج العالمي قوي، مما يدعم فكرةنا أن النماذج التي تم تدريبها من قبل FL هي قابلة للتنفيذ في جميع أنحاء أنظمة الرعاية الصحية.إنها توفر قضية مثيرة للاهتمام لاستخدام ألغاز التوقعات في رعاية المرضى COVID-19، واستخدام FL في إنشاء النماذج والتحليل.من خلال المشاركة في هذه الدراسة، تم الحصول على مواقع العملاء الوصول إلى EXAM، ليتم تحديدها بشكل متزايد قبل اتخاذ أي موافقة تشريعية أو إدماج في الرعاية السريرية في المستقبل. بالإضافة إلى العديد من المواقع التي لم تكن جزءاً من التدريب. 53 Over 200 prediction models to support decision-making in patients with COVID-19 have been published ونحن نستخدم أيضًا حالات مع حالة SARS-COV-2 غير معروفة، وبالتالي فإن النموذج يمكن أن يوفر الدعم للطبيب قبل وصول النتيجة لـ PCR مع الترجمة المباشرة (RT-PCR)، مما يجعلها مفيدة في إطار طبيعي. يتم استخدام الدعم الإشعاعي من النموذج في الممارسة العامة، على عكس النموذج الذي يستخدم الترجمة الكمبيوترية الحمراء، وهي طريقة تشخيصية غير متوقعة. كان تصميم النموذج محدودًا على المضاربات الفردية، على عكس العديد من الدراسات التي تم نشرها التي استخدمت الترجمة السريرية. 19 Patient cohort identification and data harmonization are not novel issues in research and data science , but are further complicated, when using FL, given the lack of visibility on other sites’ datasets. Improvements to clinical information systems are needed to streamline data preparation, leading to better leverage of a network of sites participating in FL. This, in conjunction with hyperparameter engineering, can allow algorithms to ‘learn’ more effectively from larger data batches and adapt model parameters to a particular site for further personalization—for example, through further fine-tuning on that site . A system that would allow seamless, close-to real-time model inference and results processing would also be of benefit and would ‘close the loop’ from training to model deployment. 54 39 وبما أن البيانات لم تصل إلى مركزية، فإنها ليست متاحة بسهولة، مع العلم أن أي تحليل مستقبلي للنتائج، إلى جانب ما تم استخدامه ومجموعه، محدود. Similar to other machine learning models, EXAM is limited by the quality of the training data. Institutions interested in deploying this algorithm for clinical care need to understand potential biases in the training. For example, the labels used as ground truth in the training of the EXAM model were derived from 24- and 72-h oxygen consumption in the patient; it is assumed that oxygen delivered to the patient equates the oxygen need. However, in the early phase of the COVID-19 pandemic, many patients were provided high-flow oxygen prophylactically regardless of their oxygen need. Such clinical practice could skew the predictions made by this model. Since our data access was limited, we did not have sufficient available information for the generation of detailed statistics regarding failure causes, post hoc, at most sites. However, we did study failure cases from the largest independent test site, CDH, and were able to generate hypotheses that we can test in the future. For high-performing sites, it seems that most failure cases fall into one of two categories: (1) low quality of input data—for example, missing data or motion artifact in CXR; or (2) out-of-distribution data—for example a very young patient. وفي المستقبل، فإننا نعتقد أيضاً أننا نعتقد أننا سنحاول التحقيق في إمكانية "الانخفاض السكاني" بسبب مراحل مختلفة من تطور المرض. ومن الممكن تحديد مساهمة كل موقع عميل إلى تحسين نموذج FL العالمي.هذا سيساعد في اختيار موقع عميل، وفي تركيز جهود الحصول على البيانات والتسريبات.هذه الأخيرة مهمة بشكل خاص مع تكلفة عالية وصعوبة التسويق من جهود هذه المجموعات الكبيرة، وسوف تتيح هذه الجهود لتجميع التنوع بدلاً من كمية كبيرة من عينات البيانات. الطرق المستقبلية قد تضم البحث التلقائي للبرمجيات , neural architecture search و غيرها من التعلم الآلي التلقائي تتمكن من العثور على المراكز التدريبية المثالية لكل موقع عميل بشكل أكثر فعالية. 55 56 57 مشكلات معروفة من النموذج النموذجي (BN) في FL تمكننا من إصلاح نموذجنا الأساسي لتخزين الميزات الصورة يمكن للعمل المستقبلي استكشاف أنواع مختلفة من التقنيات التقليدية لتمكين تدريب نموذجات الذكاء الاصطناعي في FL بشكل أكثر فعالية عندما تكون البيانات المستخدمة غير مستقلة وتوزيعًا كليًا. 58 49 عملات حديثة حول الهجمات على الخصوصية داخل إعداد FL جعلت القلق بشأن إخراج البيانات أثناء تدريب النماذج وفي الوقت نفسه، لا تزال ألغاز السلامة غير متوفرة ومحددة من قبل عوامل متعددة، في حين أن ألغاز السلامة التفاعلية التفاعلية , , تظهر حماية جيدة، قد تقلل من أداء النماذج. ألغاز التشفير، مثل التشفير الذاتي , maintain performance but may substantially increase message size and training time. A quantifiable way to measure privacy would allow better choices for deciding the minimal privacy parameters necessary while maintaining clinically acceptable performance , , . 59 36 48 49 60 36 48 49 Following further validation, we envision deployment of the EXAM model in the ED setting as a way to evaluate risk at both the per-patient and population level, and to provide clinicians with an additional reference point when making the frequently difficult task of triaging patients. We also envision using the model as a more sensitive population-level metric to help balance resources between regions, hospitals and departments. Our hope is that similar FL efforts can break the data silos and allow for faster development of much-needed AI models in the near future. الطرق التوافق الأخلاقي تم إجراء جميع الإجراءات التي تم إبرامها في مركز الصحة المعترف بها في ولاية تكساس، وفقًا لتصريحات الوكالة الدولية للصحة، وفقًا لتصريحات الوكالة الدولية للصحة المعترف بها في ولاية تكساس، والتي تم إبرامها وفقًا لتصريحات الوكالة الدولية للصحة المعترف بها في ولاية تكساس، وفقًا لتصريحات الوكالة الدولية للصحة المعترف بها في ولاية تكساس، وفقًا لتصريحات الوكالة الدولية للصحة المعترف بها في ولاية تكساس، وفقًا لتصريحات الوكالة الدولية للصحة المعترف بها في ولاية تكساس، وفقًا لتصريحات الوكالة الدولية للصحة المعترف بها في ولاية تكساس، وفقًا لتصريحات MI-CLAIM guidelines for reporting of clinical AI models were followed (Supplementary Note ) 2 Study setting The study included data from 20 institutions (Fig. ): MGB, MGH, Brigham and Women's Hospital, Newton-Wellesley Hospital, North Shore Medical Center and Faulkner Hospital; Children's National Hospital in Washington, DC; NIHR Cambridge Biomedical Research Centre; The Self-Defense Forces Central Hospital in Tokyo; National Taiwan University MeDA Lab and MAHC and Taiwan National Health Insurance Administration; Tri-Service General Hospital in Taiwan; Kyungpook National University Hospital in South Korea; Faculty of Medicine, Chulalongkorn University in Thailand; Diagnosticos da America SA in Brazil; University of California, San Francisco; VA San Diego; University of Toronto; National Institutes of Health in Bethesda, Maryland; University of Wisconsin-Madison School of Medicine and Public Health; Memorial Sloan Kettering Cancer Center in New York; and Mount Sinai Health , , استخدمت البيانات من ثلاثة مواقع مستقلة لتحديث مستقل: CDH، MVH و NCH، جميعًا في ماساتشوستس، الولايات المتحدة. كانت هذه المراكز الثلاثة لها خصائص عدد المرضى المختلفة من مواقع التدريب. 1a 61 62 63 جمع البيانات وقد أعد 20 موقعاً للعملاء ما يقرب من 16148 قضية (بالطبع إيجابية أو سلبية) لأغراض التدريب والتشخيص والتحقق من النماذج (الصور. وقد تم الوصول إلى البيانات الطبية فيما يتعلق بالمرضى الذين يتوافقون مع معايير المشاركة في الدراسة.تطلع مواقع العملاء إلى إدراج جميع الحالات الإيجابية على COVID من بداية الفيضانات في ديسمبر 2019 إلى وقت بدء التدريب المحلي على دراسة EXAM.بدأت جميع التدريب المحلي بحلول 30 سبتمبر 2020.تطلع مواقع العملاء أيضاً إلى إدراج حالات أخرى في نفس الفترة مع نتائج اختبار RT-PCR السلبية.بعد أن كان معظم المواقع لديها أكثر من SARS-COV-2 السلبية من المرضى الإيجابية، قمنا بتحديد عدد المرضى الإيجابية التي تم إدخالها إلى ما لا يقل عن 95 في المائة من الحالات الإيجابية في كل موقع العملاء. 1b كان هناك "مثل" يشمل CXR وأدوات البيانات المطلوبة التي تم اتخاذها من صحيفة المريض. تختلف توزيع وتعديلات شدة الصورة CXR (العلامات الكترونية) بشكل كبير بين المواقع بسبب مجموعة متنوعة من العوامل المرضية والموضوعية، مثل صانعي الأجهزة المختلفة والبروتوكولات الصورة، كما هو موضح في الصورة. . Patient age and EMR feature distribution varied greatly among sites, as expected owing to the differing demographics between globally distributed hospitals (Extended Data Fig. ) 1B 1C ،D 6 معايير مشاركة المرضى كان المعايير للمشاركة في المرضى: (1) كان المريض يقدم للمرضى في المستشفى أو ما يعادلها؛ (2) كان المريض يمارس اختبار RT-PCR في أي وقت بين تقديم المرضى للمرضى في المستشفى ومراجعتهم من المستشفى؛ (3) كان المريض لديه CXR في المرضى في المستشفى؛ و (4) كان سجل المريض لديه ما لا يقل عن خمس من القيم EMR المحددة في جدول. , all obtained in the ED, and the relevant outcomes captured during hospitalization. Of note, The CXR, laboratory results and vitals used were the first available for capture during the visit to the ED. The model did not incorporate any CXR, laboratory results or vitals acquired after leaving the ED. 1 Model input تم تخصيص علامات النتائج (أي حقيقة الأرض) وفقًا لمتطلبات المريض بعد فترة 24 و72 ساعة من الوصول الأولي إلى التهاب الكبد. . 1 يتم عرض توزيع معالجة الأكسجين باستخدام الأجهزة المختلفة على مواقع العملاء المختلفة في صفحة البيانات المتوسطة. ، الذي يحدد استخدام الجهاز عند الوصول إلى ED وبعد فترة 24 و 72 ساعة، ويمكن رؤية الفرق في توزيع مجموعات البيانات بين أكبر و أقل مواقع العملاء في صور البيانات المتوسطة. . 7 8 يتم تقييم عدد الحالات الإيجابية لـ COVID-19، كما تم تأكيدها من قبل اختبار RT-PCR واحد تم الحصول عليه في أي وقت بين تقديمه إلى ED وفرضه من المستشفى في جدول إضافي. . Each client site was asked to randomly split its dataset into three parts: 70% for training, 10% for validation and 20% for testing. For both 24- and 72-h outcome prediction models, random splits for each of the three repeated local and FL training and evaluation experiments were independently generated. 1 اختبار تطوير نموذج هناك تغييرات واسعة في الدورة السريرية للمرضى الذين يرسلون إلى المستشفى مع أعراض COVID-19, مع بعضهم يعانون من التدهور السريع في وظيفة التنفس التي تتطلب التدخلات المختلفة لتجنب أو تخفيف الاكسيميا. , إن قراراً حاسماً يتم اتخاذه أثناء تقييم المريض في نقطة البقاء في الرعاية الأولية، أو في مرحلة التهاب الكبد، هو ما إذا كان المريض من المرجح أن يحتاج إلى المزيد من التدابير المضادة أو التدابير المحددة على الموارد (مثل المضادة المضادة للكبد أو المضادات المضادة للكبد)، وبالتالي يجب أن يحصل على العلاج الصعب ولكن فعال، أو العلاج مع معدل المخاطر والفوائد الصغيرة بسبب الآثار الجانبية، أو مستوى أعلى من الرعاية، مثل الوصول إلى قسم الرعاية الصحية المتكاملة. . In contrast, a patient who is at lower risk of requiring invasive oxygen therapy may be placed in a less intensive care setting such as a regular ward, or even released from the ED for continuing self-monitoring at home تم تطوير EXAM لمساعدة في تحديد هذه المرضى. 62 63 64 65 من الضروري الإشارة إلى أن النماذج لم تكن موثقة من قبل أي مؤسسة تنظيمية في الوقت الحالي ويجب استخدامها فقط لأغراض البحوث. نتائج امتحانات تم تدريب EXAM باستخدام FL ، وتتلقى درجة المخاطر (المعروفة باسم درجة EXAM) مماثلة لـ CORISK (Extended Data Fig. ) and can be used in the same way to triage patients. It corresponds to a patient’s oxygen support requirements within two windows—24 and 72 h—after initial presentation to the ED. Extended Data Fig. illustrates how CORISK and the EXAM score can be used for patient triage. 27 9a 9b تم معالجة صور X-ray الحصانة للحصول على صورة الوضع الأمامي واستبعاد صور الرؤية الجانبية ، ثم تم تعديلها إلى تحديد 224 × 224. يضم النماذج معلومات من كل من ميزات EMR و CXR (بما يتماشى مع ResNet34 المتعدد مع الاهتمام الفني تم تدريبها على مجموعة البيانات CheXpert) and the Deep & Cross network لتركيب هذه الأنواع المختلفة من البيانات، تم استخراج وكيلاً خاصاً من كل صورة CXR في 512 متراً باستخدام ResNet34 المتحرك، مع الاهتمام الإقليمي، ثم تم تركيبها مع ميزات EMR كإدخال للاتصالات العميقة والمتوسطة. . We used cross-entropy as the loss function and ‘Adam’ as the optimizer. The model was implemented in Tensorflow استخدام NVIDIA Clara Train SDK تم تحديد AUC المتوسط لمهام التخصيص (≥LFO، ≥HFO/NIV أو ≥MV) واستخدامها كأرقام التقييم النهائي، مع الحد من التوازن إلى متوسط صفر ومعدل التوازن. ) 9a 66 67 68 9b 69 70 27 تخصيص الوظائف والتنظيمية ألغاز MissForest تم استخدامه لتصنيف ميزات EMR، بناءً على مجموعة البيانات التدريبية المحلية.إذا كانت ميزات EMR غير متوفرة تماماً في مجموعة البيانات من موقع المستخدم، تم استخدامه لزيادة متوسط القيمة من هذه الميزة، التي تم حسابها فقط على البيانات من مواقع مستخدمي MGB. 71 تفاصيل تسليط البيانات EMR-CXR باستخدام شبكة Deep & Cross لتصميم التفاعلات بين الميزات من بيانات EMR و CXR على مستوى الحالة ، تم استخدام خطة ميزات عميقة استناداً إلى بيئة الشبكة Deep & Cross. . Binary and categorical features for the EMR inputs, as well as 512-dimensional image features in the CXR, were transformed into fused dense vectors of real values by embedding and stacking layers. The transformed dense vectors served as input to the fusion framework, which specifically employed a crossing network to enforce fusion among input from different sources. The crossing network performed explicit feature crossing within its layers, by conducting inner products between the original input feature and output from the previous layer, thus increasing the degree of interaction across features. At the same time, two individual classic deep neural networks with several stacked, fully connected feed-forward layers were trained. The final output of our framework was then derived from the concatenation of both classic and crossing networks. 68 FL التفاصيل Arguably the most established form of FL is implemention of the federated averaging algorithm as proposed by McMahan et al. يمكن تصور FL كوسيلة تهدف إلى تقليل وظيفة الخسائر العالمية عن طريق تقليل مجموعة من وظائف الخسائر المحلية، والتي يتم تقييمها في كل موقع. من خلال تقليل خسائر الموقع المحلي لكل موقع العملاء، فضلاً عن تنسيق وزن الموقع العملاء المتعلم على خادم جمعية مركزية، يمكن أن يقلل من الخسائر العالمية دون الحاجة إلى الوصول إلى مجموعات البيانات بأكملها في موقع مركزي. كل موقع العملاء يتعلم على المستوى المحلي، ويشارك تحديث الوزن النموذجي مع خادم المركزي الذي يشارك التمويل باستخدام طبقات الأندرويد الآمنة للتشفير والتواصل بروتوكولات. يرسّم الخادم بعد ذلك مجموعة تحديث من الوزن إلى كل موقع العملاء بعد مواقع جمعية، ويستمر التدريب على المستوى المحلي. ) 72 9C يتم عرض معالجة FL في الملاحظة التالية في تجربتنا ، قمنا بتحديد عدد الجولات المشتركة في = 200، مع فترة تدريبية محددة في كل دورة على كل عميل، عدد العملاء، ، كان حتى 20 حسب الاتصال الشبكي للعميل أو البيانات المتاحة لفترة أداء محددة محددة (24 أو 72 ساعة). ، يعتمد على حجم مجموعة البيانات في كل عميل ويستخدم لتقييم مساهمة كل عميل عند جمع وزن النماذج في المتوسط المشترك.وقد تم اختيار كل موقع عميل أفضل النماذج المحلية من خلال مراقبة أداء النماذج على مجموعة التحقق المحلي.في الوقت نفسه، يتم تحديد النماذج المحلية الأفضل على أساس النماذج المحلية المتوسطة التي يتم إرسالها من كل موقع عميل إلى المورد بعد كل دورة FL.بعد الانتهاء من التدريب في FL، يتم مشاركة أفضل النماذج المحلية وأفضل النماذج المحلية تلقائيا مع جميع مواقع عميل وتقييمها على بيانات اختبارها المحلية. 1 T t K نان k When training on local data only (the baseline), we set the epoch number to 200. The Adam optimizer was used for both local training and FL with an initial learning rate of 5 × 10–5 and a stepwise learning rate decay with a factor 0.5 after every 40 epochs, which is important for the convergence of federated averaging تم تطبيق تحويلات الحساسية العشوائية ، بما في ذلك تحويلات ، الترجمة ، التقييم ، التوسع ، والضوضاء العشوائية ، والتحركات ، على الصور لتعزيز البيانات أثناء التدريب. 73 بسبب حساسية طبقات BN when dealing with different clients in a nonindependent and identically distributed setting, we found the best model performance occurred when keeping the pretrained ResNet34 with spatial attention يتم تحديد النماذج أثناء تدريب FL (أي باستخدام معدل التعلم من الصفر لأساليبها).الشبكة العميقة والمتوسطة التي تتوافق مع ميزات الصورة مع ميزات EMR لا تحتوي على أساليب BN ولذلك لم تؤثر على مشاكل عدم الاستقرار BN. 58 47 في هذه الدراسة، بحثنا نظام الحفاظ على الخصوصية الذي يشارك فقط تحديثات النماذج جزئية بين مواقع المورد والعميل. تم تقييم تحديثات الوزن خلال كل تقييم حسب حجم الدعم، وحوالي نسبة معينة من تحديثات الوزن الأكبر تم تقييمها مع المورد. (ب) (البيانات المتقدمة الصادرة عن Fig. ) ، التي تم حسابها من جميع الترددات غير الصغرى ، Δ يمكن أن يكون مختلفًا لكل عميل. في كل دورة قد تشمل التعديلات على هذا النظام إزالة إضافية من المرتفعات الكبيرة أو أنظمة الخصوصية التفاعلية. that add random noise to the gradients, or even to the raw data, before feeding into the network . k 5 الـمـسـلـمـيـن k t 49 51 التحليل الإحصائي أجريت اختبار WILCOXON Signed-Rank لتأكيد أهمية تحسينات الأداء الملاحظة بين النماذج التي تم تدريبها على المستوى المحلي و النماذج التي تم تدريبها على FL على 24 و 72 ساعة (الصور. اكسسوارات البيانات المرتفعة. ). The null hypothesis was rejected with one-sided 1 × 10–3 في كلا الحالتين. 2 1 P تم تقييم التكلفة المرتبطة بجودة التكلفة المرتبطة بجودة التكلفة المرتبطة بجودة التكلفة المرتبطة بجودة التكلفة المرتبطة بجودة التكلفة المرتبطة بجودة التكلفة المرتبطة بجودة التكلفة ( = 0.43 ، = 0.035, درجات الحرية (df) = 17 بالنسبة إلى نموذج 24 ساعة و = 0.62, = 0.003, df = 16 بالنسبة إلى نموذج 72h).هذا يؤكد أن حجم مجموعة البيانات وحدها ليس العنصر الوحيد الذي يحدد قوة نموذج إلى البيانات غير المرئية. r P r P للمقارنة بين معادلات ROC من نموذج FL العالمي والمنتجات المحلية التي تم تدريبها في المواقع المختلفة (البيانات المتوسطة. ) ، قمنا بتحميل 1000 نموذج من البيانات وتحديد AUC المكتوب. ثم قمنا بتحديد الفرق بين الجانبين وتصنيفها باستخدام الصيغة = (AUC1 – AUC2) / أين ما هو الفرق المعتدلة؟ (AUC1 و AUC2 هي سلسلة AUC المتواجدة المتواجدة المتواجدة المتواجدة) with normal distribution, we obtained the values illustrated in Supplementary Table وقد أظهرت النتائج أن الفكرة 0 قد تم ردها بسهولة جدا. values, indicating the statistical significance of the superiority of FL outcomes. The computation of تم إجراء الأرقام في R مع مكتبة pROC . 3 D s D s D P 2 P P 74 نظرًا لأن النموذج يتوقع النتيجة الفريدة، وهي النتيجة المستمرة من 0 إلى 1، فمن غير الممكن تقييم التقييم المباشر مثل qqplot. ). We conducted one-way analysis of variation (ANOVA) tests to compare local and FL model scores among four ground truth categories (RA, LFO, HFO, MV). The -حسابات، التي تم حسابها كالتغيرات بين العينات من خلال تقسيم التغيرات داخل العينات وتشكل درجة التفرق بين المجموعات المختلفة، استخدمت لتقييم النماذج. -الحجمات من خمسة مواقع محددة مختلفة هي 245.7, 253.4, 342.3, 389.8 و 634.8, بينما الحجم من نموذج FL هو 843.5. -القيم تعني أن المجموعات أكثر تفرقًا، وتظهر الأرقام من نموذج FL لدينا بوضوح تفرقًا أكبر بين أربعة فئات الحقيقة الأساسية. قيمة اختبار ANOVA على النموذج FL هو <2 × 10-16 ، مما يدل على أن أرقام توقعات FL تختلف بشكل ملحوظ إحصائيًا بين فئات الاختبار المختلفة. 10 F F F P Reporting Summary معلومات إضافية عن تصميم البحث متوفرة في linked to this article. تقارير البحث الطبيعي الوصول إلى البيانات تم استخدام هذه البيانات للتدريب في كل من المواقع المحلية ولم يتم مشاركتها مع أي من المؤسسات المشاركة الأخرى أو مع المورد المشترك، ولا يتم الوصول إليها بشكل عام. يتم الحفاظ على البيانات من المواقع التحقيقية المستقلة من قبل CAMCA، ويمكن طلب الوصول إليه من خلال الاتصال ب Q.L. استناداً إلى تحديد من قبل CAMCA، يمكن تنفيذ مراجعة تبادل البيانات والتعديل من IRB لأغراض البحوث من قبل إدارة البحوث MGB وفقاً للسياسة والسياسة MGB. كود متاح جميع الكود والبرمجيات المستخدمة في هذه الدراسة متوفرة بشكل عام في NGC. لتسجيل الوصول أو التسجيل كمدير أو إنشاء ملف، قم بإدخال أحد الملفات المتوفرة أدناه.المنتجات التي تم تدريبها، وإرشادات إعداد البيانات، وإرشادات التدريب، وإجراء اختبار النماذج، ومجلد readme، وإرشادات تثبيت وإرشادات الترخيص متوفرة بشكل عام في NVIDIA NGC : : يتوفر برنامج التعلم المشترك كجزء من نظام Clara Train SDK: بدلا من ذلك، تستخدم هذه الخطوة لتنزيل النماذج "wget --content-disposition" -أو clara_train_covid19_exam_ehr_xray_1.zip”. 61 https://ngc.nvidia.com/catalog/models/nvidia:med:clara_train_covid19_exam_ehr_xray https://ngc.nvidia.com/catalog/containers/nvidia:clara-train-sdk https://api.ngc.nvidia.com/v2/models/nvidia/med/clara_train_covid19_exam_ehr_xray/versions/1/zip التقارير Budd, J. et al. Digital technologies in the public-health response to COVID-19. , 1183–1192 (2020). Nat. Med. 26 Moorthy, V., Henao Restrepo, A. M., Preziosi, M.-P. & Swaminathan, S. Data sharing for novel coronavirus (COVID-19). , 150 (2020). Bull. World Health Organ. 98 Chen, Q., Allot, A. & Lu, Z. Keep up with the latest coronavirus research. , 193 (2020). Nature 579 Fabbri, F., Bhatia, A., Mayer, A., Schlotter, B. & Kaiser, J. BCG IT spend pulse: how COVID-19 is shifting tech priorities. (2020). https://www.bcg.com/publications/2020/how-covid-19-is-shifting-big-it-spend Candelon, F., Reichert, T., Duranton, S., di Carlo, R. C. & De Bondt, M. The rise of the AI-powered company in the postcrisis world. (2020). https://www.bcg.com/en-gb/publications/2020/business-applications-artificial-intelligence-post-covid Chao, H. et al. Integrative analysis for COVID-19 patient outcome prediction. , 101844 (2021). Med. Image Anal. 67 Zhu, X. et al. Joint prediction and time estimation of COVID-19 developing severe symptoms using chest CT scan. , 101824 (2021). Med. Image Anal. 67 Yang, D. et al. Federated semi-supervised learning for Covid region segmentation in chest ct using multi-national data from China, Italy, Japan. , 101992 (2021). Med. Image Anal. 70 Minaee, S., Kafieh, R., Sonka, M., Yazdani, S. & Jamalipour Soufi, G. Deep-COVID: predicting COVID-19 from chest X-ray images using deep transfer learning. , 101794 (2020). Med. Image Anal. 65 COVID-19 Studies from the World Health Organization Database. (2020). https://clinicaltrials.gov/ct2/who_table ACTIV. (2020). https://www.nih.gov/research-training/medical-research-initiatives/activ Coronavirus Treatment Acceleration Program (CTAP). US Food and Drug Administration (2020). https://www.fda.gov/drugs/coronavirus-covid-19-drugs/coronavirus-treatment-acceleration-program-ctap Gleeson, P., Davison, A. P., Silver, R. A. & Ascoli, G. A. A commitment to open source in neuroscience. , 964–965 (2017). Neuron 96 Piwowar, H. et al. The state of OA: a large-scale analysis of the prevalence and impact of open access articles. , e4375 (2018). PeerJ. 6 European Society of Radiology (ESR). What the radiologist should know about artificial intelligence – an ESR white paper. , 44 (2019). Insights Imaging 10 Pesapane, F., Codari, M. & Sardanelli, F. Artificial intelligence in medical imaging: threat or opportunity? Radiologists again at the forefront of innovation in medicine. , 35 (2018). Eur. Radiol. Exp. 2 Price, W. N. 2nd & Cohen, I. G. Privacy in the age of medical big data. , 37–43 (2019). Nat. Med. 25 Liang, W. et al. Development and validation of a clinical risk score to predict the occurrence of critical illness in hospitalized patients with COVID-19. , 1081–1089 (2020). JAMA Intern. Med. 180 Wynants, L. et al. Prediction models for diagnosis and prognosis of covid-19 infection: systematic review and critical appraisal. , m1328 (2020). Brit. Med. J. 369 Zhang, L. et al. D-dimer levels on admission to predict in-hospital mortality in patients with Covid-19. , 1324–1329 (2020). J. Thromb. Haemost. 18 Sands, K. E. et al. Patient characteristics and admitting vital signs associated with coronavirus disease 2019 (COVID-19)-related mortality among patients admitted with noncritical illness. (2020). https://doi.org/10.1017/ice.2020.461 American College of Radiology. CR recommendations for the use of chest radiography and computed tomography (CT) for suspected COVID-19 infection. (2020). https://www.acr.org/Advocacy-and-Economics/ACR-Position-Statements/Recommendations-for-Chest-Radiography-and-CT-for-Suspected-COVID19-Infection Rubin, G. D. et al. The role of chest imaging in patient management during the COVID-19 pandemic: a multinational consensus statement from the Fleischner Society. , 172–180 (2020). Radiology 296 World Health Organization. Use of chest imaging in COVID-19. (2020). https://www.who.int/publications/i/item/use-of-chest-imaging-in-covid-19 Jamil, S. et al. Diagnosis and management of COVID-19 disease. , 10 (2020). Am. J. Respir. Crit. Care Med. 201 Redmond, C. E., Nicolaou, S., Berger, F. H., Sheikh, A. M. & Patlas, M. N. Emergency radiology during the COVID-19 pandemic: The Canadian Association of Radiologists Recommendations for Practice. , 425–430 (2020). Can. Assoc. Radiologists J. 71 Buch, V. et al. Development and validation of a deep learning model for prediction of severe outcomes in suspected COVID-19 Infection. Preprint at (2021). https://arxiv.org/abs/2103.11269 Lyons, C. & Callaghan, M. The use of high-flow nasal oxygen in COVID-19. , 843–847 (2020). Anaesthesia 75 Whittle, J. S., Pavlov, I., Sacchetti, A. D., Atwood, C. & Rosenberg, M. S. Respiratory support for adult patients with COVID-19. , 95–101 (2020). J. Am. Coll. Emerg. Physicians Open 1 Ai, J., Li, Y., Zhou, X. & Zhang, W. COVID-19: treating and managing severe cases. , 370–371 (2020). Cell Res. 30 Esteva, A. et al. A guide to deep learning in healthcare. , 24–29 (2019). Nat. Med. 25 Cahan, E. M., Hernandez-Boussard, T., Thadaney-Israni, S. & Rubin, D. L. Putting the data before the algorithm in big data addressing personalized healthcare. , 78 (2019). NPJ Digit. Med. 2 Thrall, J. H. et al. Artificial intelligence and machine learning in radiology: opportunities, challenges, pitfalls, and criteria for success. , 504–508 (2018). J. Am. Coll. Radiol. 15 Shilo, S., Rossman, H. & Segal, E. Axes of a revolution: challenges and promises of big data in healthcare. , 29–38 (2020). Nat. Med. 26 Gao, Y. & Cui, Y. Deep transfer learning for reducing health care disparities arising from biomedical data inequality. , 5131 (2020). Nat. Commun. 11 Rieke, N. et al. The future of digital health with federated learning. , 119 (2020). NPJ Dig. Med. 3 Yang, Q., Liu, Y., Chen, T. & Tong, Y. Federated machine learning: concept and applications. , 12 (2019). ACM Trans. Intell. Syst. Technol. 10 Ma, C. et al. On safeguarding privacy and security in the framework of federated learning. , 242–248 (2020). IEEE Netw. 34 Brisimi, T. S. et al. Federated learning of predictive models from federated Electronic Health Records. , 59–67 (2018). Int. J. Med. Inform. 112 Roth, H. R. et al. Federated learning for breast density classification: a real-world implementation. In , (eds. Albarqouni, S. et al.) Vol. 12,444, 181–191 (Springer International Publishing, 2020). Proc. Second MICCAI Workshop, DART 2020 and First MICCAI Workshop, DCL 2020 Domain Adaptation and Representation Transfer, and Distributed and Collaborative Learning Sheller, M. J. et al. Federated learning in medicine: facilitating multi-institutional collaborations without sharing patient data. , 12598 (2020). Sci. Rep. 10 Remedios, S. W., Butman, J. A., Landman, B. A. & Pham, D. L. in (eds Remedios, S. W. et al.) (Springer, 2020). Federated Gradient Averaging for Multi-Site Training with Momentum-Based Optimizers Xu, Y. et al. A collaborative online AI engine for CT-based COVID-19 diagnosis. Preprint at (2020). https://www.medrxiv.org/content/10.1101/2020.05.10.20096073v2 Raisaro, J. L. et al. SCOR: A secure international informatics infrastructure to investigate COVID-19. , 1721–1726 (2020). J. Am. Med. Inform. Assoc. 27 Vaid, A. et al. Federated learning of electronic health records to improve mortality prediction in hospitalized patients with COVID-19: machine learning approach. , e24207 (2021). JMIR Med. Inform. 9 Nino, G. et al. Pediatric lung imaging features of COVID-19: a systematic review and meta-analysis. , 252–263 (2021). Pediatr. Pulmonol. 56 Fredrikson, M., Jha, S. & Ristenpart, T. Model inversion attacks that exploit confidence information and basic countermeasures. In 1322–1333, (2015). Proc. 22nd ACM SIGSAC Conference on Computer and Communications Security https://doi.org/10.1145/2810103.2813677 Zhu, L., Liu, Z. & Han, S. in (eds Wallach, H. et al.) 14774–14784 (Curran Associates, Inc., 2019). Advances in Neural Information Processing Systems 32 Kaissis, G. A., Makowski, M. R., Rückert, D. & Braren, R. F. Secure, privacy-preserving and federated machine learning in medical imaging. , 305–311 (2020). Nat. Mach. Intell. 2 Li, W. et al. in 133–141 (Springer, 2019). Privacy-Preserving Federated Brain Tumour Segmentation Shokri, R. & Shmatikov, V. Privacy-preserving deep learning. In (2015). Proc. 53rd Annual Allerton Conference on Communication, Control, and Computing (Allerton) https://doi.org/10.1109/allerton.2015.7447103 Li, X. et al. Multi-site fMRI analysis using privacy-preserving federated learning and domain adaptation: ABIDE results. , 101765 (2020). Med. Image Anal. 65 Estiri, H. et al. Predicting COVID-19 mortality with electronic medical records. , 15 (2021). NPJ Dig. Med. 4 Jiang, G. et al. Harmonization of detailed clinical models with clinical study data standards. , 65–74 (2015). Methods Inf. Med. 54 Yang, D. et al. in . (2019). Searching Learning Strategy with Reinforcement Learning for 3D Medical Image Segmentation https://doi.org/10.1007/978-3-030-32245-8_1 Elsken, T., Metzen, J. H. & Hutter, F. Neural architecture search: a survey. , 1–21 (2019). J. Mach. Learning Res. 20 Yao, Q. et al. Taking human out of learning applications: a survey on automated machine learning. Preprint at (2019). https://arxiv.org/abs/1810.13306 Ioffe, S. & Szegedy, C. Batch normalization: accelerating deep network training by reducing internal covariate shift. In , PMLR , 448–456 (2015). Proc. 32nd International Conf. Machine Learning 37 Kaufman, S., Rosset, S. & Perlich, C. Leakage in data mining: formulation, detection, and avoidance. In , 556–563 (2011). Proc. 17th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining Zhang, C. et al. BatchCrypt: efficient homomorphic encryption for cross-silo federated learning. In , 493–506 (2020). Proc. 2020 USENIX Annual Technical Conference, ATC 2020 . (2020). Nvidia NGC Catalog: COVID-19 Related Models https://ngc.nvidia.com/catalog/models?orderBy=scoreDESC&pageNumber=0&query=covid&quickFilter=models&filters Marini, J. J. & Gattinoni, L. Management of COVID-19 respiratory distress. , 2329–2330 (2020). JAMA 323 Cook, T. M. et al. Consensus guidelines for managing the airway in patients with COVID-19: Guidelines from the Difficult Airway Society, the Association of Anaesthetists the Intensive Care Society, the Faculty of Intensive Care Medicine and the Royal College of Anaesthetist. , 785–799 (2020). Anaesthesia 75 Galloway, J. B. et al. A clinical risk score to identify patients with COVID-19 at high risk of critical care admission or death: an observational cohort study. , 282–288 (2020). J. Infect. 81 Kilaru, A. S. et al. Return hospital admissions among 1419 COVID-19 patients discharged from five U.S. emergency departments. , 1039–1042 (2020). Acad. Emerg. Med. 27 He, K., Zhang, X., Ren, S. & Sun, J. Deep residual learning for image recognition. In (2016). Proc. 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR) https://doi.org/10.1109/cvpr.2016.90 Irvin, J. et al. CheXpert: a large chest radiograph dataset with uncertainty labels and expert comparison. , 590–597 (2019). Proc. AAAI Conf. Artif. Intell. 33 Wang, R., Fu, B., Fu, G. & Wang, M. Deep & Cross network for Ad Click predictions. In Article no. 12 (2017). Proc. ADKDD’17 Abadi, M. et al. TensorFlow: asystem for large-scale machine learning. In , USENIX Association 265–283 (2016). 12th USENIX Symposium on Operating Systems Design and Implementation (OSDI 16) . (2020). NVIDIA Clara Imaging https://developer.nvidia.com/clara-medical-imaging Stekhoven, D. J. & Bühlmann, P. MissForest–non-parametric missing value imputation for mixed-type data. , 112–118 (2012). Bioinformatics 28 McMahan, H., Moore, E., Ramage, D., Hampson, S. & y Arcas, B. A. Communication-efficient learning of deep networks from decentralized data. (2017). http://proceedings.mlr.press/v54/mcmahan17a.html Hsieh, K., Phanishayee, A., Mutlu, O. & Gibbons, P. B. The non-IID data quagmire of decentralized machine learning. In PMLR 119 (2020). Proc. 37th International Conf. Machine Learning Robin, X. et al. pROC: an open-source package for R and S+ to analyze and compare ROC curves. , 77 (2011). BMC Bioinformatics 12 الاعترافات The views expressed in this study are those of the authors and not necessarily those of the NHS, the NIHR, the Department of Health and Social Care or any of the organizations associated with the authors. MGB thank the following individuals for their support: J. Brink, Department of Radiology, Massachusetts General Hospital, Harvard Medical School, Boston, MA; M. Kalra, Department of Radiology, Massachusetts General Hospital, Harvard Medical School, Boston, MA; N. Neumark, Center for Clinical Data Science, Massachusetts General Brigham, Boston, MA; T. Schultz, Department of Radiology, Massachusetts General Hospital, Boston, MA; N. Guo, Center for Advanced Medical Computing and Analysis, Department of Radiology, Massachusetts General Hospital, Harvard Medical School, Boston, MA; J. K. Cramer, Director, QTIM lab at the Athinoula A. Martinos Center for Biomedical Imaging at MGH; S. Pomerantz, Department of Radiology, Massachusetts General Hospital, Harvard Medical School, Boston, MA; G. Boland, Department of Radiology, Brigham and Women’s Hospital, Harvard Medical School, Boston, MA; W. Mayo-Smith, Department of Radiology, Brigham and Women’s Hospital, Harvard Medical School, Boston, MA. UCSF thank P. B. Storey, J. Chan and J. Block for implementing the UCSF FL client infrastructure, and W. Tellis for providing the source imaging repository for this work. The UCSF EMR and clinical notes for this study were accessed via the COVID-19 Research Data Mart, من خلال كلية الطب ، تمنح الجامعة تشيللونغ كولن مؤسسة Ratchadapisek Sompoch Endowment Fund RA (PO) (مجموع 001/63) لتجميع وإدارة البيانات السريرية والمواد البيولوجية ذات الصلة بـ COVID-19 للمجموعة العليا للبحوث ، كلية الطب ، جامعة تشيللونغ كولن. تشكر مركز NIHR جامعة كامبريدج للبحوث البيولوجية ، وزارة الصحة الوطنية ، تايوان ، وزارة العلوم والتكنولوجيا ، وشركة NIHR (Cambridge Biomedical Research Centre at Cambridge University Hospitals NHS Foundation Trust). National Taiwan University MeDA Lab و MAHC و Taiwan National Health Insurance Administration MOST Joint Research Center for AI technology ، All Vista Healthcare National Health Insurance Administration ، تايوان ، وزارة التكنولوجيا https://data.ucsf.edu/covid19 هذه المقالة متوفرة في الطبيعة تحت لائحة CC by 4.0 Deed (Attribution 4.0 International). هذه الرسالة هي تحت رخصة CC by 4.0 Deed (Attribution 4.0 International). متاحة في الطبيعة