लेखक : Nicola Rieke Jonny Hancox Wenqi Li Fausto Milletarì Holger R. Roth Shadi Albarqouni Spyridon Bakas Mathieu N. Galtier Bennett A. Landman Klaus Maier-Hein Sébastien Ourselin Micah Sheller Ronald M. Summers Andrew Trask Daguang Xu Maximilian Baust M. Jorge Cardoso लेखक : निकोल रिक जॉनी हेनकोक्स वेंटिलेशन ली Fausto Milletarì के बारे में होल्डर आर. रॉथ श्याम अल्बर्ट्ज स्पिरिडॉन बैकस मैथ्यू एन. गैलेियर बेनेट ए. लैंडमैन केलू Maier-Hein सेबस्टेन ओर्सेलिन माइक शेलर रोनाल्ड एम. सैमर्स एंड्रयू ट्रैक दाऊद ने मैक्सिलिन बाउस्ट जॉर्ज कार्डोसो अवलोकन डेटा-आधारित मशीन सीखना (एमएल) चिकित्सा डेटा से सटीक और मजबूत सांख्यिकीय मॉडल बनाने के लिए एक आशाजनक दृष्टिकोण के रूप में उभरा है, जिसे आधुनिक स्वास्थ्य देखभाल प्रणालियों द्वारा विशाल मात्रा में एकत्र किया जाता है. मौजूदा चिकित्सा डेटा को एमएल द्वारा पूरी तरह से प्रयोग नहीं किया जाता है मुख्य रूप से क्योंकि यह डेटा सिलॉस में बैठता है और गोपनीयता चिंताएं इस डेटा तक पहुंच को प्रतिबंधित करती हैं. हालांकि, पर्याप्त डेटा तक पहुंच के बिना, एमएल को अपनी पूरी क्षमता तक पहुंचने से रोक दिया जाएगा और, अंततः, अनुसंधान से नैदानिक अभ्यास में संक्रमण करने से रोक दिया जाएगा. इस लेख में इस मुद्दे में योगदान करने वाले प्रमुख कार परिचय कृत्रिम बुद्धि (एआई) पर अनुसंधान, और विशेष रूप से मशीन सीखने (एमएल) और गहरी सीखने (डीएल) में प्रगति आधुनिक डीएल मॉडल लाखों मापदंडों को शामिल करते हैं जिन्हें पर्याप्त बड़े क्यूरेट किए गए डेटा से सीखने की आवश्यकता होती है ताकि नैदानिक स्तर की सटीकता हासिल की जा सके, जबकि सुरक्षित, उचित, उचित और अविश्वसनीय डेटा को सामान्य करने में सक्षम हों , , , . 1 2 3 4 5 उदाहरण के लिए, एक एआई-आधारित ट्यूमर डिटेक्टर को प्रशिक्षित करने के लिए एक बड़े डेटाबेस की आवश्यकता होती है जिसमें संभावित एनाटॉमी, रोग, और इनपुट डेटा प्रकार का पूरा स्पेक्ट्रम शामिल है. इस तरह के डेटा प्राप्त करना मुश्किल है, क्योंकि स्वास्थ्य डेटा अत्यधिक संवेदनशील है और इसका उपयोग कड़ाई से विनियमित है यहां तक कि अगर डेटा अनामीकरण इन प्रतिबंधों को दूर कर सकता है, तो अब यह अच्छी तरह से समझा जाता है कि रोगी के नाम या जन्म तिथि जैसे मेटाडेटा को हटाना अक्सर गोपनीयता बनाए रखने के लिए पर्याप्त नहीं होता है। उदाहरण के लिए, कंप्यूटर टॉमोग्राफी (सीटी) या मैग्नेटिक रिज़ोनेशन इमेजिंग (एमआरआई) डेटा से एक रोगी के चेहरे को पुनर्निर्माण करना संभव है एक और कारण है कि डेटा साझा करना स्वास्थ्य देखभाल में व्यवस्थित नहीं है यह है कि एक उच्च गुणवत्ता वाले डेटा सेट को इकट्ठा करना, संसाधित करना और बनाए रखना काफी समय, प्रयास और खर्च लेता है. परिणामस्वरूप, ऐसे डेटा सेट के पास महत्वपूर्ण व्यावसायिक मूल्य हो सकता है, जिससे यह कम संभावना है कि उन्हें स्वतंत्र रूप से साझा किया जाएगा. इसके बजाय, डेटा इकट्ठाकर्ता अक्सर उन डेटा पर अच्छी तरह से नियंत्रण रखते हैं जो उन्होंने एकत्र किए हैं. 6 7 8 संघीय शिक्षा (FL) , , यह एक सीखने का पैराग्राम है जो डेटा शासन और गोपनीयता की समस्या को संबोधित करने का प्रयास करता है, एल्गोरिथ्मों को सहयोग से प्रशिक्षित करके डेटा स्वयं का आदान-प्रदान किए बिना। , हाल ही में स्वास्थ्य देखभाल अनुप्रयोगों के लिए ट्रैकिंग हासिल किया , , , , , , , . एलएल एक संगठित रूप से अंतर्दृष्टि प्राप्त करने की अनुमति देता है, उदाहरण के लिए, एक सहमत मॉडल के रूप में, रोगी डेटा को उन संस्थानों के फायरवॉल से परे स्थानांतरित किए बिना जिसमें वे निवास करते हैं. इसके बजाय, एलएल प्रक्रिया स्थानीय रूप से प्रत्येक भाग लेने वाली संस्थान में होती है और केवल मॉडल विशेषताएं (उदाहरण के लिए, पैरामीटर, ग्रेडियंस) चित्रित के रूप में स्थानांतरित की जाती हैं। हाल के अनुसंधान से पता चला है कि एफएल द्वारा प्रशिक्षित मॉडल केंद्रीय रूप से होस्ट किए गए डेटा सेट पर प्रशिक्षित लोगों के समान प्रदर्शन स्तर प्राप्त कर सकते हैं और उन मॉडल से बेहतर हैं जो केवल अलग-अलग एकल संस्थान डेटा देखते हैं , . 9 10 11 12 13 14 15 16 17 18 19 20 1 16 17 FL aggregation सर्वर - विशिष्ट FL कार्य प्रवाह जिसमें प्रशिक्षण नोड्स का एक संघ ग्लोबल मॉडल प्राप्त करता है, अपने आंशिक रूप से प्रशिक्षित मॉडल को एक केंद्रीय सर्वर को अस्थायी रूप से aggregation के लिए भेजता है और फिर सहमत मॉडल पर प्रशिक्षण जारी करता है कि सर्वर वापस करता है। FL peer to peer – FL का एक वैकल्पिक सूत्र जिसमें प्रत्येक प्रशिक्षण नोड अपने आंशिक रूप से प्रशिक्षित मॉडल को अपने कुछ या सभी सहकर्मियों के साथ आदान-प्रदान करता है और प्रत्येक अपने स्वयं के aggregation करता है। केंद्रित प्रशिक्षण – सामान्य गैर-एफएल प्रशिक्षण कार्य प्रवाह जिसमें डेटा प्राप्त करने वाले साइट अपने डेटा को एक केंद्रीय डेटा झील में दान करते हैं जहां से वे और अन्य लोग स्थानीय, स्वतंत्र प्रशिक्षण के लिए डेटा निकाल सकते हैं। a b c FL का एक सफल कार्यान्वयन इस प्रकार बड़े पैमाने पर सटीक चिकित्सा को सक्षम करने के लिए एक महत्वपूर्ण संभावना रख सकता है, जिसके परिणामस्वरूप मॉडल निष्पक्ष निर्णय लेते हैं, एक व्यक्ति की शारीरिकता को इष्टतम रूप से प्रतिबिंबित करते हैं, और दुर्लभ बीमारियों के प्रति संवेदनशील होते हैं, जबकि प्रबंधन और गोपनीयता चिंताओं का सम्मान करते हैं। हम डिजिटल स्वास्थ्य के लिए एक संघीय भविष्य की कल्पना करते हैं और इस परिप्रेक्ष्य कागज के साथ, हम एकीकृत दृष्टिकोण को साझा करते हैं, जिसका उद्देश्य चिकित्सा अनुप्रयोगों के लिए एफएल के लाभों और प्रभाव के बारे में समुदाय को संदर्भ और विवरण प्रदान करना है (सेक्शन "डेटा-आधारित चिकित्सा को एकीकृत प्रयासों की आवश्यकता होती है"), साथ ही साथ डिजिटल स्वास्थ्य के लिए एफएल को लागू करने के प्रमुख विचारों और चुनौतियों को उजागर करना है (सेक्शन "तकनीकी विचार"). डेटा-आधारित चिकित्सा को संघीय प्रयासों की आवश्यकता है ML and especially DL is becoming the de facto knowledge discovery approach in many industries, but successfully implementing data-driven applications requires large and diverse data sets. However, medical data sets are difficult to obtain (subsection “The reliance on data”). FL addresses this issue by enabling collaborative learning without centralising data (subsection “The promise of federated efforts”) and has already found its way to digital health applications (subsection “Current FL efforts for digital health”). This new learning paradigm requires consideration from, but also offers benefits to, various healthcare stakeholders (section “Impact on stakeholders”). डेटा पर भरोसा डेटा-आधारित दृष्टिकोण डेटा पर भरोसा करते हैं जो वास्तव में समस्या के अंतर्निहित डेटा वितरण का प्रतिनिधित्व करते हैं. हालांकि यह एक अच्छी तरह से ज्ञात आवश्यकता है, हालिया एल्गोरिथ्म आमतौर पर सावधानीपूर्वक क्यूरेटेड डेटा सेट पर मूल्यांकन किए जाते हैं, अक्सर केवल कुछ स्रोतों से आते हैं. यह बाधाओं को पेश कर सकता है जहां जनगणना (उदाहरण के लिए, लिंग, उम्र) या तकनीकी असंतुलन (उदाहरण के लिए, अधिग्रहण प्रोटोकॉल, उपकरण निर्माता) पूर्वानुमानों को विकृत करते हैं और विशिष्ट समूहों या साइटों के लिए सटीकता को प्रतिकूल रूप से प्रभावित करते हैं. हालांकि, रोग पैटर्न, सामाजिक- आईए प्रशिक्षण के लिए बड़े डेटाबेस की आवश्यकता ने कई पहलुओं को जन्म दिया है जो कई संस्थानों से डेटा को इकट्ठा करना चाहते हैं. ये डेटा अक्सर तथाकथित डेटा झीलों में एकत्र किए जाते हैं. ये डेटा के वाणिज्यिक मूल्य का लाभ उठाने के उद्देश्य से बनाए गए हैं, उदाहरण के लिए, आईबीएम के Merge Healthcare अधिग्रहण , या आर्थिक विकास और वैज्ञानिक प्रगति के लिए एक संसाधन के रूप में, उदाहरण के लिए, एनएचएस स्कॉटलैंड के राष्ट्रीय सुरक्षित बंदरगाह फ्रेंच स्वास्थ्य डेटा हब , और स्वास्थ्य डेटा अनुसंधान UK . 21 22 23 24 महत्वपूर्ण, हालांकि छोटे, पहलुओं में मानव कनेक्टॉम शामिल है ब्रिटेन Biobank , the Cancer Imaging Archive (TCIA) NIH CXR8 के लिए गहरी चोटें Cancer Genome Atlas (TCGA) के बारे में Alzheimer’s Disease Neuroimaging Initiative (ADNI) के बारे में चिकित्सा में भी बड़ी चुनौतियां कैमलिन चुनौती अंतर्राष्ट्रीय मस्तिष्क ट्यूमर सेगमेंटेशन (BraTS) , , or the Medical Segmentation Decathlon सार्वजनिक चिकित्सा डेटा आमतौर पर कार्य या बीमारी विशिष्ट है और अक्सर लाइसेंस प्रतिबंधों के विभिन्न डिग्री के साथ जारी किया जाता है, कभी-कभी इसका उपयोग सीमित करता है। 25 26 27 28 29 30 31 32 33 34 35 36 37 डेटा को केंद्रित करना या जारी करना, हालांकि, न केवल नियामक, नैतिक और कानूनी चुनौतियों का सामना करता है, जो गोपनीयता और डेटा संरक्षण से संबंधित हैं, बल्कि तकनीकी चुनौतियों का भी सामना करता है। एनीमेशन, एक्सेस को नियंत्रित करना और सुरक्षित रूप से स्वास्थ्य देखभाल डेटा को स्थानांतरित करना एक गैर-ट्रिवियल, और कभी-कभी असंभव कार्य है। जीनॉमिक डेटा और चिकित्सा छवियों के लिए भी यही लागू होता है जो उन्हें एक उंगली के निशान के रूप में अद्वितीय बनाता है इसलिए, जब तक अनामीकरण प्रक्रिया डेटा की सच्चाई को नष्ट नहीं करती है, जो संभवतः इसे बेकार कर देती है, तो रोगी की पुनः पहचान या जानकारी के लीक को बाहर नहीं किया जा सकता है. गेट पहुंच अनुमोदित उपयोगकर्ताओं के लिए अक्सर इस समस्या का एक संभावित समाधान के रूप में प्रस्तावित किया जाता है. हालांकि, डेटा की उपलब्धता को सीमित करने के अलावा, यह केवल उन मामलों के लिए व्यावहारिक है जहां डेटा मालिकों द्वारा दी गई सहमति बिना शर्त है, क्योंकि उन लोगों से डेटा को वापस बुलाना जो डेटा तक पहुंच कर सकते हैं, व्यावहारिक रूप से निष्पादित नहीं किया जा सकता है. 7 38 संघीय प्रयासों का वादा FL का वादा सरल है – गोपनीयता और डेटा प्रबंधन चुनौतियों को संबोधित करने के लिए, गैर सह-स्थानीय डेटा से एमएल को सक्षम करने के द्वारा। एक एफएल सेटिंग में, प्रत्येक डेटा नियंत्रक न केवल अपने स्वयं के प्रबंधन प्रक्रियाओं और संबंधित गोपनीयता नीतियों को परिभाषित करता है, बल्कि डेटा पहुंच को नियंत्रित करता है और इसे रद्द करने की क्षमता है। इसमें प्रशिक्षण और सत्यापन चरण दोनों शामिल हैं। इस तरह, एफएल नए अवसर पैदा कर सकता है, उदाहरण के लिए, बड़े पैमाने पर, संस्थागत सत्यापन की अनुमति देकर, या दुर्लभ रोगों पर नए शोध की अनुमति देकर, जहां घटना दर कम हैं और प्रत्येक संस्था में डेटा सेट बहुत छोटे हैं। मॉडल को डेटा में स्थानांतरित करना जैसा कि Fig में दिखाया गया है। , एक एफएल कार्य प्रवाह विभिन्न टोपोलॉजी और कंप्यूटिंग योजनाओं के साथ किया जा सकता है. स्वास्थ्य देखभाल अनुप्रयोगों के लिए दो सबसे आम हैं एक aggregation सर्वर के माध्यम से , , Peer to Peer के बारे में , सभी मामलों में, एफएल निहित रूप से एक निश्चित स्तर की गोपनीयता प्रदान करता है, क्योंकि एफएल प्रतिभागियों को अन्य संस्थानों से डेटा तक सीधे कभी पहुंच नहीं होती है और केवल मॉडल पैरामीटर प्राप्त होते हैं जो कई प्रतिभागियों पर एकत्र किए जाते हैं। , , , इसलिए, अलग-अलग गोपनीयता जैसे तंत्र , एफएल सेटिंग में गोपनीयता को और बढ़ाने के लिए एफएल के एन्क्रिप्टेड डेटा से सीखने का प्रस्ताव दिया गया है (जैसे "टेक्निकल विचारों" अनुभाग)। और FL तकनीक एक बढ़ती अनुसंधान क्षेत्र है , . 2 16 17 18 15 39 40 41 42 43 44 45 46 12 20 FL टोपोलॉजी - एक संघ की संचार वास्तुकला। केंद्रित: एकीकरण सर्वर प्रशिक्षण पुनरावृत्तियों को समन्वित करता है और मॉडल इकट्ठा करता है, इकट्ठा करता है और प्रशिक्षण नोड्स (हब और स्पॉक) से वितरित करता है। decentralized: प्रत्येक प्रशिक्षण नोड को एक या अधिक समकक्षों से जुड़ा हुआ है और प्रत्येक नोड पर समानांतर रूप से एकत्र होता है। एलर्जी: एलर्जी के कई हिस्सों में एलर्जी के कई हिस्सों में एलर्जी के कई हिस्सों में एलर्जी का एक हिस्सा होता है ( )). एफएल कंप्यूटिंग योजनाएं—कई भागीदारों के माध्यम से एक मॉडल की मार्गदर्शन। अनुक्रमिक प्रशिक्षण / साइकिल ट्रांसफर सीखना। एकीकरण सर्वर, Peer को Peer बनाएं a b c d e f g डिजिटल स्वास्थ्य के लिए वर्तमान एफएल प्रयास चूंकि FL एक सामान्य सीखने का पैराडाइम है जो एआई मॉडल विकास के लिए डेटा एकत्र करने की आवश्यकता को खत्म करता है, FL के अनुप्रयोगों की श्रृंखला स्वास्थ्य देखभाल के लिए एआई के पूरे क्षेत्र को कवर करती है. बड़ी डेटा भिन्नता को पकड़ने और विभिन्न आबादी के बीच रोगियों का विश्लेषण करने का अवसर प्रदान करके, FL भविष्य के लिए विनाशकारी नवाचारों को सक्षम कर सकता है लेकिन अभी भी काम कर रहा है। इलेक्ट्रॉनिक स्वास्थ्य रिकॉर्ड (ईएचआर) के संदर्भ में, उदाहरण के लिए, एफएल क्लिनिक रूप से समान रोगियों का प्रतिनिधित्व करने और खोजने में मदद करता है , , साथ ही दिल की घटनाओं के कारण अस्पताल में भर्ती की भविष्यवाणी , मृत्यु दर और ICU रहने का समय एफएल के अनुप्रयोग और लाभों को मेडिकल इमेजिंग के क्षेत्र में भी दिखाया गया है, एमआरआई में पूरे मस्तिष्क के विभाजन के लिए , साथ ही मस्तिष्क ट्यूमर सेगमेंटेशन , हाल ही में, इस तकनीक को बीमारी से संबंधित विश्वसनीय जैव मार्कर खोजने के लिए fMRI वर्गीकरण के लिए उपयोग किया गया है। और COVID-19 के संदर्भ में एक आशाजनक दृष्टिकोण के रूप में सुझाव दिया . 13 47 14 19 15 16 17 18 48 यह ध्यान देने योग्य है कि एफएल प्रयासों के लिए उपयोग की जाने वाली सीमा, उद्देश्य और प्रौद्योगिकियों को परिभाषित करने के लिए समझौते की आवश्यकता होती है, जो, क्योंकि यह अभी भी नया है, इस संदर्भ में, आज के बड़े पैमाने पर पहल वास्तव में स्वास्थ्य देखभाल अनुप्रयोगों में सुरक्षित, उचित और अभिनव सहयोग के लिए कल के मानकों के अग्रणी हैं। इनमें शामिल हैं consortia जो आगे बढ़ने का लक्ष्य रखते हैं विश्वसनीय संघीय डेटा विश्लेषण (TFDA) परियोजना जर्मन कैंसर कंसोर्टियम के संयुक्त इमेजिंग प्लेटफॉर्म , जो जर्मन मेडिकल इमेजिंग अनुसंधान संस्थानों के भीतर decentralized अनुसंधान की अनुमति देते हैं. एक अन्य उदाहरण एक अंतरराष्ट्रीय अनुसंधान सहयोग है जो एमएमजी का मूल्यांकन करने के लिए एआई मॉडल के विकास के लिए FL का उपयोग करता है अध्ययन में पाया गया कि एफएल-जनित मॉडल एकल संस्थान के डेटा पर प्रशिक्षित लोगों से बेहतर प्रदर्शन करते थे और अधिक सामान्य करने योग्य थे, इसलिए वे अभी भी अन्य संस्थानों के डेटा पर अच्छी तरह से प्रदर्शन करते थे। अकादमिक 49 50 51 स्वास्थ्य संस्थानों को जोड़कर, जो अनुसंधान केंद्रों तक सीमित नहीं हैं, एफएल सीधे हो सकता है चल रही HealthChain परियोजना , उदाहरण के लिए, फ्रांस में चार अस्पतालों में एक एफएल फ्रेमवर्क विकसित करने और तैनात करने का उद्देश्य है. यह समाधान सामान्य मॉडल उत्पन्न करता है जो स्तन कैंसर और मेलेनोमा रोगियों के लिए उपचार प्रतिक्रिया की भविष्यवाणी कर सकते हैं. यह ऑन्कोलॉजिस्टों को अपने histology स्लाइड या dermoscopy छवियों से प्रत्येक रोगी के लिए सबसे प्रभावी उपचार का निर्धारण करने में मदद करता है. एक और बड़े पैमाने पर प्रयास फेडरेट ट्यूमर सेगमेंटेशन (FeTS) पहल है , जो 30 प्रतिबद्ध स्वास्थ्य देखभाल संस्थानों का एक अंतरराष्ट्रीय संघ है जो एक ग्राफिक उपयोगकर्ता इंटरफ़ेस के साथ एक ओपन-सॉर्ड एफएल फ्रेमवर्क का उपयोग करता है. लक्ष्य मस्तिष्क ग्लोमा, स्तन ट्यूमर, यकृत ट्यूमर और कई माइलोमा रोगियों से हड्डियों के घावों का पता लगाने में सुधार करना है। क्लिनिक 52 53 प्रभाव का एक और क्षेत्र है अनुसंधान और अनुवाद. FL सहयोगी अनुसंधान, यहां तक कि प्रतिस्पर्धी कंपनियों के लिए भी अनुमति देता है. इस संदर्भ में, सबसे बड़े पहलुओं में से एक है Melloddy परियोजना यह एक परियोजना है जिसका उद्देश्य दस फार्मास्यूटिकल कंपनियों के डेटा सेटों में बहु-टॉक्स एफएल को तैनात करना है. एक सामान्य पूर्वानुमान मॉडल को प्रशिक्षित करके, जिससे पता चलता है कि रासायनिक यौगिकों को प्रोटीन में कैसे बाध्य किया जाता है, भागीदार अपने अत्यधिक मूल्यवान आंतरिक डेटा को प्रकट किए बिना दवा खोज प्रक्रिया को अनुकूलित करना चाहते हैं। औद्योगिक 54 हितधारकों पर प्रभाव FL केंद्रित डेटा झीलों से पैरामिडम स्विच को शामिल करता है और FL पारिस्थितिकी तंत्र में विभिन्न हितधारकों पर इसके प्रभाव को समझना महत्वपूर्ण है। क्लिनिक चिकित्सकों को आमतौर पर आबादी के एक उप-संस्करण के संपर्क में रखा जाता है, जो उनके स्थान और जनसांख्यिकीय वातावरण के आधार पर होता है, जो कुछ बीमारियों की संभावना या उनके आपस में कनेक्शन के बारे में विरोधाभासी धारणाओं का कारण बन सकता है। एमएल-आधारित प्रणालियों का उपयोग करके, उदाहरण के लिए, एक दूसरा पाठक के रूप में, वे अन्य संस्थानों से विशेषज्ञ ज्ञान के साथ अपनी विशेषज्ञता को बढ़ा सकते हैं, जिससे आज तक संभव नहीं है कि निदान की स्थिरता सुनिश्चित की जाए। हालांकि यह सामान्य रूप से एमएल-आधारित प्रणाली के लिए लागू होता है, एक संघीय तरीके से प्रशिक्षित प्रणालियों को संभावित रूप से कम विरोधाभासी निर्णय और दुर्लभ मामलों के लिए रोगी रोगियों को आमतौर पर स्थानीय रूप से इलाज किया जाता है. वैश्विक पैमाने पर एफएल स्थापित करना उपचार के स्थान के बावजूद उच्च गुणवत्ता वाले नैदानिक निर्णयों को सुनिश्चित कर सकता है. विशेष रूप से, दूरस्थ क्षेत्रों में चिकित्सा देखभाल की आवश्यकता वाले रोगियों को उच्च गुणवत्ता वाले एफएल-सहायताकृत निदान से लाभ हो सकता है जो बड़ी संख्या में मामलों वाले अस्पतालों में उपलब्ध हैं. यह भी दुर्लभ, या भौगोलिक रूप से दुर्लभ, रोगों के लिए सच है, जिनके परिणाम अधिक हल्के हो सकते हैं यदि तेजी से और अधिक सटीक निदान किए जा सकते हैं. एफएल भी डेटा दान करने के लिए बाधा को कम कर सकता है, क्योंकि रोगियों को आश्वस्त किया जा सकता है कि डेटा अपने स्वयं के संस्थान अस्पताल और प्रथाएं अस्पतालों और प्रथाओं को डेटा पहुंच के पूर्ण ट्रैकिंग के साथ अपने रोगी डेटा के पूर्ण नियंत्रण और स्वामित्व में रह सकते हैं, तीसरे पक्ष द्वारा दुरुपयोग के जोखिम को सीमित करते हुए। हालांकि, इसमें स्थानीय कंप्यूटिंग बुनियादी ढांचे में निवेश या निजी क्लाउड सेवा प्रदान करने और मानकीकृत और सिनोप्टिक डेटा प्रारूपों का पालन करने की आवश्यकता होगी ताकि एमएल मॉडल को अनुकूल रूप से प्रशिक्षित और मूल्यांकित किया जा सके। आवश्यक कंप्यूटिंग क्षमता की मात्रा निश्चित रूप से इस बात पर निर्भर करती है कि एक साइट केवल मूल्यांकन और परीक्षण प्रयासों में भाग ले रही है या प्रशिक्षण प्रयासों में भी शामिल है। अनुसंधान और AI डेवलपर्स शोधकर्ताओं और एआई डेवलपर्स को संभावित रूप से विशाल वास्तविक डेटा संग्रहों तक पहुंच से लाभ मिलता है, जो निश्चित रूप से छोटे अनुसंधान प्रयोगशालाओं और स्टार्ट-अप को प्रभावित करेगा. इस प्रकार, संसाधनों को खुले डेटा सेट की सीमित आपूर्ति पर भरोसा करने के बजाय नैदानिक जरूरतों और संबंधित तकनीकी समस्याओं को हल करने के लिए निर्देशित किया जा सकता है. उसी समय, संघीय प्रशिक्षण के लिए एल्गोरिथमिक रणनीतियों पर अनुसंधान करना आवश्यक होगा, उदाहरण के लिए, मॉडल या अद्यतन को प्रभावी ढंग से कैसे जोड़ें, वितरित बदलावों के लिए कैसे मजबूत हों , , एफएल-आधारित विकास का मतलब यह भी है कि शोधकर्ता या एआई डेवलपर उन सभी डेटा का पता लगाने या देखने में सक्षम नहीं हैं जिन पर मॉडल को प्रशिक्षित किया जाता है, उदाहरण के लिए, यह समझने के लिए एक व्यक्तिगत विफलता के मामले को देखने के लिए संभव नहीं है कि वर्तमान मॉडल उस पर क्यों खराब प्रदर्शन करता है। 11 12 20 स्वास्थ्य सेवा प्रदाता कई देशों में स्वास्थ्य देखभाल प्रदाताओं को वॉल्यूम-आधारित, यानी सेवा-आधारित, से मूल्य-आधारित स्वास्थ्य देखभाल के लिए चल रहे पैराग्राम स्विच से प्रभावित होता है, जो बदले में सटीक चिकित्सा की सफलतापूर्वक स्थापना के साथ मजबूत रूप से जुड़ा हुआ है। यह अधिक महंगी व्यक्तिगत चिकित्साओं को बढ़ावा देने के बारे में नहीं है, बल्कि अधिक केंद्रित उपचार के माध्यम से बेहतर परिणामों को जल्दी प्राप्त करने के बारे में है, जिससे लागत कम हो सकती है. एफएल में स्वास्थ्य देखभाल एआई की सटीकता और मजबूतता को बढ़ाने की क्षमता है, जबकि लागत को कम करता है और रोगी परिणामों में सुधार करता है, और इसलिए सटीक चिकित्सा के लिए महत्वपूर्ण हो सकता है. निर्माताओं स्वास्थ्य देखभाल सॉफ्टवेयर और हार्डवेयर निर्माता भी FL से लाभ उठा सकते हैं, क्योंकि कई उपकरणों और अनुप्रयोगों से सीखने का संयोजन, रोगी विशिष्ट जानकारी का खुलासा किए बिना, अपने ML-आधारित सिस्टम की निरंतर सत्यापन या सुधार को सुविधाजनक बना सकता है। तकनीकी विचार FL शायद Konečnỳ et al. के काम से सबसे अच्छी तरह से जाना जाता है। , लेकिन साहित्य में कई अन्य परिभाषाएं पेश की गई हैं , , , एक FL कार्यप्रणाली (Fig. ) विभिन्न टोपोलॉजी और गणना योजनाओं के माध्यम से प्राप्त किया जा सकता है (चित्र. ), लेकिन लक्ष्य एक ही रहता है, अर्थात्, गैर सह-स्थानीय डेटा से सीखने वाली ज्ञान को जोड़ना. इस अनुभाग में, हम अधिक विस्तार से चर्चा करेंगे कि एफएल क्या है, साथ ही प्रमुख चुनौतियों और तकनीकी विचारों को उजागर करते हैं जो डिजिटल स्वास्थ्य में एफएल को लागू करते समय उत्पन्न होते हैं. 55 9 11 12 20 1 2 संघीय सीखने की परिभाषा FL एक सीखने का पैराग्राम है जिसमें कई पार्टियां डेटा सेट का आदान-प्रदान या केंद्रित करने की आवश्यकता के बिना सहयोग से प्रशिक्षित होती हैं. FL का एक सामान्य वर्णन निम्नानुसार पढ़ता है: Let denote a global loss function obtained via a weighted combination of स्थानीय नुकसान, निजी डेटा से गणना , जो व्यक्तिगत भागीदारों में रहता है और कभी भी उनके बीच साझा नहीं किया जाता है: K xk कहां > 0 संबंधित वजन योग्यताओं को दर्शाता है। जीएसटी व्यावहारिक रूप से, प्रत्येक प्रतिभागी आमतौर पर एक वैश्विक सहमति मॉडल प्राप्त और परिष्कृत करता है, स्थानीय रूप से और अपडेट साझा करने से पहले, या तो सीधे या पैरामीटर सर्वर के माध्यम से, कुछ अनुकूलन चक्रों का संचालन करके। ) , पैरामीटरों को एकत्र करने की वास्तविक प्रक्रिया नेटवर्क टोपोलॉजी पर निर्भर करती है, क्योंकि नोड्स भौगोलिक या कानूनी प्रतिबंधों के कारण उप-नेटर्स में विभाजित हो सकते हैं (चित्र देखें। जोड़ने की रणनीतियां एकल जोड़ने वाले नोड (हब और स्पॉट मॉडल) पर भरोसा कर सकती हैं, या किसी भी केंद्रितता के बिना कई नोडों पर। , एल्गोरिथ्म 1 में एक केंद्रित एफएल जोड़ने का एक उदाहरण दिया गया है, जबकि ध्यान दें कि जोड़ने की रणनीतियों को पूर्ण मॉडल अद्यतन के बारे में जानकारी की आवश्यकता नहीं होती है; ग्राहक संचार ओवरहेड को कम करने के लिए मॉडल पैरामीटरों के केवल एक उपसेट को साझा करना चुन सकते हैं, बेहतर गोपनीयता संरक्षण सुनिश्चित करते हैं। या कई कार्य सीखने के एल्गोरिथ्म का उत्पादन करने के लिए केवल उनके पैरामीटरों का एक हिस्सा एक संघीय तरीके से सीखा गया है। 1 9 12 2 15 56 10 विभिन्न प्रशिक्षण योजनाओं को सक्षम करने वाले एकीकृत ढांचा कंप्यूटर संसाधनों (डेटा और सर्वर) को कंप्यूटर से अलग कर सकता है। जैसा कि Fig में दिखाया गया है। बाद में कई भागीदारों में एक मॉडल की ट्रैक्चर को परिभाषित करता है, जिसे विशेष डेटा सेट पर प्रशिक्षित और मूल्यांकित किया जाना चाहिए। कंप्यूटर योजना 2 चुनौतियां और विचार FL के लाभों के बावजूद, यह सभी मुद्दों को हल नहीं करता है जो चिकित्सा डेटा पर सीखने में निहित हैं. एक सफल मॉडल प्रशिक्षण अभी भी डेटा की गुणवत्ता, पूर्वाग्रह और मानकीकरण जैसे कारकों पर निर्भर करता है इन मुद्दों को उचित उपायों के माध्यम से, जैसे सावधानीपूर्वक अध्ययन डिजाइन, डेटा अधिग्रहण के लिए सामान्य प्रोटोकॉल, संरचित रिपोर्टिंग और पूर्वाग्रह और छिपे हुए परतों को खोजने के लिए परिष्कृत पद्धतियों के माध्यम से समन्वयित और गैर-अंतरराष्ट्रीय सीखने के प्रयासों के लिए हल किया जाना चाहिए। निम्नलिखित में, हम एफएल के प्रमुख पहलुओं को संबोधित करते हैं जो डिजिटल स्वास्थ्य पर लागू होने पर विशेष रूप से प्रासंगिक हैं और एफएल को स्थापित करते समय ध्यान में रखा जाना चाहिए। , , . 2 11 12 20 डेटा heterogeneity चिकित्सा डेटा विशेष रूप से विविध है - न केवल मोडलिंग, आयाम और विशेषताओं की विविधता के कारण, बल्कि एक विशिष्ट प्रोटोकॉल के भीतर भी, जैसे कि अधिग्रहण अंतर, चिकित्सा उपकरण की ब्रांड या स्थानीय आबादी के कारण। इन परिस्थितियों में असफल होने की संभावना , , , आंशिक रूप से सहयोगी सीखने की रणनीतियों के उद्देश्य को हराता है. हालांकि, हाल के परिणाम बताते हैं कि एफएल प्रशिक्षण अभी भी संभव है , यहां तक कि अगर चिकित्सा डेटा संस्थानों में समान रूप से वितरित नहीं होता है , या एक स्थानीय बायोपिक शामिल है इस समस्या को हल करने के लिए अनुसंधान में शामिल हैं, उदाहरण के लिए, डेटा साझा करने की रणनीति और FL डोमेन अनुकूलन के साथ एक और चुनौती यह है कि डेटा अद्वितीयता ऐसी स्थिति में हो सकती है जहां वैश्विक इष्टतम समाधान एक व्यक्तिगत स्थानीय प्रतिभागियों के लिए इष्टतम नहीं हो सकता है. मॉडल प्रशिक्षण इष्टतमता का परिभाषा, इसलिए, प्रशिक्षण से पहले सभी प्रतिभागियों द्वारा सहमत होना चाहिए. फीडिंग 9 9 57 58 59 16 17 51 फीडप्रॉक्स 57 58 18 गोपनीयता और सुरक्षा स्वास्थ्य देखभाल डेटा अत्यधिक संवेदनशील है और इसे उचित गोपनीयता प्रक्रियाओं का पालन करके संरक्षित किया जाना चाहिए. इसलिए, प्रमुख विचारों में से कुछ फ्लैट की गोपनीयता-संरक्षण क्षमता के संबंध में समझौता, रणनीतियों और बाकी जोखिम हैं. गोपनीयता के मुकाबले प्रदर्शन: यह ध्यान रखना महत्वपूर्ण है कि FL सभी संभावित गोपनीयता मुद्दों को हल नहीं करता है और - सामान्य रूप से एमएल एल्गोरिथ्म के समान - हमेशा कुछ जोखिम लेगा। हालांकि, प्रदर्शन के संदर्भ में एक समझौता है और ये तकनीकें, उदाहरण के लिए, अंतिम मॉडल की सटीकता को प्रभावित कर सकती हैं इसके अलावा, भविष्य की तकनीकों और / या सहायक डेटा का उपयोग पहले कम जोखिम के रूप में माना गया एक मॉडल को खतरे में डालने के लिए किया जा सकता है। 12 10 विश्वसनीयता का स्तर: व्यापक रूप से, भाग लेने वाले पार्टियां दो प्रकार की एफएल सहयोग में प्रवेश कर सकती हैं: - एफएल कंसोर्टियस के लिए जहां सभी पार्टियों को विश्वसनीय माना जाता है और एक लागू सहयोग समझौते द्वारा बाध्य किया जाता है, हम अधिक खतरनाक प्रेरणाओं में से कई को खत्म कर सकते हैं, जैसे संवेदनशील जानकारी निकालने या मॉडल को जानबूझकर भ्रष्ट करने के इरादे। भरोसा —एफएल प्रणालियों में जो बड़े पैमाने पर काम करते हैं, यह एक निष्पादित सहयोग समझौते स्थापित करना असंभव हो सकता है. कुछ ग्राहक जानबूझकर प्रदर्शन को कम करने की कोशिश कर सकते हैं, सिस्टम को नीचे ला सकते हैं या अन्य पक्षों से जानकारी निकाल सकते हैं. इस प्रकार, इन जोखिमों को कम करने के लिए सुरक्षा रणनीतियों की आवश्यकता होगी, जैसे, मॉडल प्रस्तुतियों का उन्नत एन्क्रिप्शन, सभी पक्षों की सुरक्षित प्रमाणन, कार्रवाई की ट्रैकिंग, भिन्न गोपनीयता, सत्यापन प्रणालियों, निष्पादन अखंडता, मॉडल गोपनीयता और विरोधियों के हमलों के खिलाफ सुरक्षा। अविश्वास जानकारी का रिसाव: परिभाषा से, एफएल सिस्टम प्रतिभागियों के बीच स्वास्थ्य देखभाल डेटा को साझा करने से बचते हैं. हालांकि, साझा जानकारी अभी भी अप्रत्यक्ष रूप से स्थानीय प्रशिक्षण के लिए उपयोग की जाने वाली निजी डेटा को प्रकट कर सकती है, उदाहरण के लिए, मॉडल विपरीत द्वारा मॉडल अद्यतन के लिए, ग्रेडिएंट्स स्वयं विरोधी हमले , FL पारंपरिक प्रशिक्षण से अलग है क्योंकि प्रशिक्षण प्रक्रिया को कई पार्टियों के संपर्क में रखा जाता है, जिससे विपरीत इंजीनियरिंग के माध्यम से लीक के जोखिम को बढ़ाया जाता है यदि प्रतिद्वंद्वी समय के साथ मॉडल परिवर्तनों का निरीक्षण कर सकते हैं, विशिष्ट मॉडल अद्यतन का पालन कर सकते हैं (यानी, एक ही संस्थान की अद्यतन), या मॉडल को संभाल सकते हैं (उदाहरण के लिए, ग्रेडेंट-एस्सिंट-स्टाइल हमलों के माध्यम से दूसरों द्वारा अतिरिक्त स्मृति को प्रेरित करते हैं)। , और पर्याप्त अलग गोपनीयता सुनिश्चित करना , आवश्यक हो सकता है और अभी भी एक सक्रिय अनुसंधान क्षेत्र है . 60 61 62 63 16 18 44 12 ट्रैकिंग और जिम्मेदारी सभी सुरक्षा महत्वपूर्ण अनुप्रयोगों के रूप में, एक प्रणाली की पुनरावृत्ति स्वास्थ्य देखभाल में एफएल के लिए महत्वपूर्ण है। केंद्रित प्रशिक्षण के विपरीत, एफएल उन वातावरणों में बहुपक्षीय गणनाओं की आवश्यकता होती है जो हार्डवेयर, सॉफ्टवेयर और नेटवर्क के संदर्भ में काफी विविधता दिखाते हैं। डेटा एक्सेस इतिहास, प्रशिक्षण कॉन्फ़िगरेशन और हाइपरपैरामीटर ट्यूनिंग सहित सभी सिस्टम संपत्तियों की ट्रैकिंग अनिवार्य है। विशेष रूप से गैर-विश्वसनीय संघों में, ट्रैकिंग और रिपोर्टिंग प्रक्रियाओं को निष्पादन अखंडता की आवश्यकता होती है। प्रशिक्षण प्रक्रिया के बाद पारस्परिक रूप से सहमत मॉडल अनुकूलन मानदंडों तक पहुंच जाता है, यह प्रत्येक प्रतिभागियों के योग . One implication of FL is that researchers are not able to investigate data upon which models are being trained to make sense of unexpected results. Moreover, taking statistical measurements of their training data as part of the model development workflow will need to be approved by the collaborating parties as not violating privacy. Although each site will have access to its own raw data, federations may decide to provide some sort of secure intra-node viewing facility to cater for this need or may provide some other way to increase explainability and interpretability of the global model. 64 System architecture McMahan et al. जैसे उपभोक्ता उपकरणों के बीच बड़े पैमाने पर FL चलाने के विपरीत। , स्वास्थ्य देखभाल संस्थानों के प्रतिभागियों को अपेक्षाकृत शक्तिशाली गणना संसाधनों और विश्वसनीय, उच्च प्रवाह नेटवर्क के साथ सुसज्जित किया जाता है जो कई अधिक स्थानीय प्रशिक्षण चरणों के साथ बड़े मॉडल को प्रशिक्षित करने और नोड्स के बीच अधिक मॉडल जानकारी साझा करने की अनुमति देता है। 9 ऐसी संघीयता का प्रशासन विभिन्न तरीकों से किया जा सकता है। पार्टियों के बीच सबसे सख्त डेटा गोपनीयता की आवश्यकता वाली स्थितियों में, प्रशिक्षण किसी तरह के "मानव ब्रोकर" प्रणाली के माध्यम से संचालित हो सकता है, जिसमें एक विश्वसनीय तीसरा पक्ष मध्यस्थ के रूप में कार्य करता है और डेटा तक पहुंच को सुविधाजनक बनाता है। इस सेटअप को एक स्वतंत्र इकाई की आवश्यकता होती है जो समग्र प्रणाली को नियंत्रित करती है, जो हमेशा वांछनीय नहीं हो सकती है, क्योंकि इसमें अतिरिक्त लागत और प्रक्रिया विस्कोसता शामिल हो सकती है। हालांकि, इसका फायदा यह है कि सटीक आंतरिक तंत्र ग्राहकों से दूर खींचा जा सकता है, जिससे सिस्टम को अपडेट करने के लिए अधिक गतिशील और सरल बनाया जाता है। एक पीई निष्कर्ष एमएल, और विशेष रूप से डीएल, डिजिटल स्वास्थ्य देखभाल के क्षेत्र में नवाचारों की एक विस्तृत श्रृंखला का नेतृत्व किया है। जैसा कि सभी एमएल विधियों को डेटा तक पहुंचने की क्षमता से बहुत फायदा होता है जो वास्तविक वैश्विक वितरण के करीब है, एफएल एक शक्तिशाली, सटीक, सुरक्षित, मजबूत और निष्पक्ष मॉडल प्राप्त करने के लिए एक आशाजनक दृष्टिकोण है। डेटा सेट को साझा करने या केंद्रित करने की आवश्यकता के बिना कई पार्टियों को सहयोग से प्रशिक्षित करने की अनुमति देकर, एफएल सटीक रूप से संवेदनशील चिकित्सा डेटा के उभरने से संबंधित मुद्दों को संबोधित करता है। नतीजतन, यह नई अनुसंधान और व्यापार मार्गों को खोल सकता है और वैश्विक स्तर पर इसके बावजूद, हम वास्तव में मानते हैं कि सटीक चिकित्सा पर इसके संभावित प्रभाव और अंततः चिकित्सा देखभाल में सुधार बहुत आशाजनक है। 12 रिपोर्ट संक्षिप्त अनुसंधान डिजाइन के बारे में अधिक जानकारी उपलब्ध है इस लेख से जुड़े प्रकृति अनुसंधान रिपोर्ट संदर्भ LeCun, Y., Bengio, Y. & Hinton, G. Deep learning. , 436 (2015). Nature 521 Wang, F., Casalino, L. P. & Khullar, D. Deep learning in medicine—promise, progress, and challenges. , 293–294 (2019). JAMA Intern. Med. 179 Chartrand, G. et al. Deep learning: a primer for radiologists. , 2113–2131 (2017). Radiographics 37 De Fauw, J. et al. Clinically applicable deep learning for diagnosis and referral in retinal disease. , 1342 (2018). Nat. Med. 24 Sun, C., Shrivastava, A., Singh, S. & Gupta, A. Revisiting unreasonable effectiveness of data in deep learning era. In , 843–852 ( , 2017). Proceedings of the IEEE international conference on computer vision IEEE Van Panhuis, W. G. et al. A systematic review of barriers to data sharing in public health. , 1144 (2014). BMC Public Health 14 Rocher, L., Hendrickx, J. M. & De Montjoye, Y.-A. Estimating the success of re-identifications in incomplete datasets using generative models. , 1–9 (2019). Nat. Commun. 10 Schwarz, C. G. et al. Identification of anonymous mri research participants with face-recognition software. , 1684–1686 (2019). N. Engl. J. Med. 381 McMahan, B., Moore, E., Ramage, D., Hampson, S. & y Arcas, B. A. Communication-efficient learning of deep networks from decentralized data. In , 1273–1282. (2017). Artificial Intelligence and Statistics https://scholar.google.de/scholar?hl=de&as_sdt=0%2C5&q=Communicationefficient+learning+of+deep+networks+from+decentralized+data&btnG= Li, T., Sahu, A. K., Talwalkar, A. & Smith, V. Federated learning: Challenges, methods, and future directions. , 50–60 (IEEE, 2020). IEEE Signal Processing Magazine 37 Yang, Q., Liu, Y., Chen, T. & Tong, Y. Federated machine learning: concept and applications. , 12 (2019). ACM Trans. Intell. Syst. Technol. (TIST) 10 Kairouz, P. et al. Advances and open problems in federated learning. (2019). arXiv preprint arXiv:1912.04977 Lee, J. et al. Privacy-preserving patient similarity learning in a federated environment: development and analysis. , e20 (2018). JMIR Med. Inform. 6 Brisimi, T. S. et al. Federated learning of predictive models from federated electronic health records. , 59–67 (2018). Int. J. Med. Inform. 112 Roy, A. G., Siddiqui, S., Pölsterl, S., Navab, N. & Wachinger, C. Braintorrent: a peer-to-peer environment for decentralized federated learning. (2019). arXiv preprint arXiv:1905.06731 Li, W. et al. Privacy-preserving federated brain tumour segmentation. In , 133–141 (Springer, 2019). International Workshop on Machine Learning in Medical Imaging Sheller, M. J., Reina, G. A., Edwards, B., Martin, J. & Bakas, S. Multi-institutional deep learning modeling without sharing patient data: a feasibility study on brain tumor segmentation. In , 92–104 (Springer, 2018). International MICCAI Brainlesion Workshop Li, X. et al. Multi-site fmri analysis using privacy-preserving federated learning and domain adaptation: abide results. (2020). arXiv preprint arXiv:2001.05647 Huang, L. et al. Patient clustering improves efficiency of federated machine learning to predict mortality and hospital stay time using distributed electronic medical records. , 103291 (2019). J. Biomed. Inform. 99 Xu, J. & Wang, F. Federated learning for healthcare informatics. (2019). arXiv preprint arXiv:1911.06270 Roy, A. & Banerjee, A. Ibm’s merge healthcare acquisitio . (2015) (Accessed 10 February 2020). n https://www.reuters.com/article/us-merge-healthcare-m-a-ibm/ibm-to-buy-merge-healthcare-in-1-billion-deal-idUSKCN0QB1ML20150806 Nhs scotland’s national safe haven. (2015) (Accessed 10 February 2020). https://www.gov.scot/publications/charter-safe-havens-scotland-handling-unconsented-data-national-health-service-patient-records-support-research-statistics/pages/4/ Cuggia, M. & Combes, S. The french health data hub and the german medical informatics initiatives: Two national projects to promote data sharing in healthcare. , 195–202 (2019). Yearbook Med. Informat. 28 Health Data Research UK. (Health Data Research UK, 2020) (Accessed 10 Feb 2020). https://www.hdruk.ac.uk/ Sporns, O., Tononi, G. & Kötter, R. The human connectome: a structural description of the human brain. . , e42, (2005). PLoS Comput. Biol 1 https://doi.org/10.1371/journal.pcbi.0010042 Sudlow, C. et al. Uk biobank: an open access resource for identifying the causes of a wide range of complex diseases of middle and old age. . , e1001779. (2015). PLoS Med 12 https://doi.org/10.1371/journal.pmed.1001779 Clark, K. et al. The cancer imaging archive (tcia): maintaining and operating a public information repository. , 1045–1057 (2013). J. Digit. Imaging. 26 Wang, X. et al. Chestx-ray8: Hospital-scale chest X-ray database and benchmarks on weakly-supervised classification and localization of common thorax diseases. In , 2097–2106 ( , 2017). Proceedings of the IEEE conference on computer vision and pattern recognition IEEE Yan, K., Wang, X., Lu, L. & Summers, R. M. Deeplesion: automated mining of large-scale lesion annotations and universal lesion detection with deep learning. , 036501 (2018). J Med. Imaging. 5 Tomczak, K., Czerwińska, P. & Wiznerowicz, M. The cancer genome atlas (tcga): an immeasurable source of knowledge. , A68 (2015). Contemp. Oncol. 19 Jack Jr., C. R. et al. The alzheimer’s disease neuroimaging initiative (adni): Mri methods. , 685–691 (2008). J. Magn. Reson. Imaging 27 . (2020) (Accessed 24 July 2020). Grand Challenge-a Platform for End-to-end Development of Machine Learning Solutions in Biomedical Imaging https://grand-challenge.org/ Litjens, G. et al. 1399 h&e-stained sentinel lymph node sections of breast cancer patients: the camelyon dataset. , giy065 (2018). GigaScience 7 Menze, B. H. et al. The multimodal brain tumor image segmentation benchmark (brats). , 1993–2024 (2014). IEEE Trans. Med. Imaging 34 Bakas, S. et al. Identifying the best machine learning algorithms for brain tumor segmentation, progression assessment, and overall survival prediction in the brats challenge. (2018). arXiv preprint arXiv:1811.02629 Bakas, S. et al. Advancing the cancer genome atlas glioma MRI collections with expert segmentation labels and radiomic features. , 170117 (2017). Sci. Data 4 Simpson, A. L. et al. A large annotated medical image dataset for the development and evaluation of segmentation algorithms. (2019). arXiv preprint arXiv:1902.09063 Yeh, F.-C. et al. Quantifying differences and similarities in whole-brain white matter architecture using local connectome fingerprints. , e1005203 (2016). PLoS Comput. Biol. 12 Chang, K. et al. Distributed deep learning networks among institutions for medical imaging. , 945–954 (2018). J. Am. Med. Inform. Assoc. 25 Shokri, R., Stronati, M., Song, C. & Shmatikov, V. Membership inference attacks against machine learning models. In , 3-18 (IEEE, 2017). 2017 IEEE Symposium on Security and Privacy (SP) Sablayrolles, A., Douze, M., Ollivier, Y., Schmid, C. & Jégou, H. White-box vs black-box: Bayes optimal strategies for membership inference. In Chaudhuri, K. & Salakhutdinov, R. (eds) , 5558–5567. (PMLR, 2019). Proceedings of the 36th International Conference on Machine Learning, {ICML} 97 http://proceedings.mlr.press/v97/sablayrolles19a.html Zhang, C., Bengio, S., Hardt, M., Recht, B. & Vinyals, O. Understanding deep learning requires rethinking generalization. In , (OpenReview.net, 2017). 5th International Conference on Learning Representations, {ICLR}. https://openreview.net/forum?id=Sy8gdB9xx Carlini, N., Liu, C., Erlingsson, Ú., Kos, J. & Song, D. The secret sharer: evaluating and testing unintended memorization in neural networks. In Heninger, N. & Traynor, P. (eds) { } ({ } , 267–284. ({USENIX} Association, Santa Clara, CA, USA, 2019). 28th USENIX Security Symposium USENIX Security 19 https://www.usenix.org/conference/usenixsecurity19/presentation/carlini Abadi, M. et al. Deep learning with differential privacy. In , 308–318 (ACM, 2016). Proceedings of the 2016 ACM SIGSAC Conference on Computer and Communications Security Shokri, R. & Shmatikov, V. Privacy-preserving deep learning. In , 1310–1321 (ACM, 2015). Proceedings of the 22nd ACM SIGSAC conference on computer and communications security Langlotz, C. P. et al. A roadmap for foundational research on artificial intelligence in medical imaging: from the 2018 nih/rsna/acr/the academy workshop. , 781–791 (2019). Radiology 291 Kim, Y., Sun, J., Yu, H. & Jiang, X. Federated Tensor Factorization for Computational Phenotyping. In . 887–895. (ACM, Halifax, NS, Canada, 2017). Proceedings of the 23rd {ACM} {SIGKDD} International Conference on Knowledge Discoveryand Data Mining https://doi.org/10.1145/3097983.3098118 He, C., Annavaram, M. & Avestimehr, S. Fednas: Federated deep learning via neural architecture search. (2020). https://sites.google.com/view/cvpr20-nas/ Trustworthy federated data analytics (tfda). (2020) (Accessed 28 May 2020). https://tfda.hmsp.center/ Joint Imaging Platform (Jip). (2020) (Accessed 28 May 2020). https://jip.dktk.dkfz.de/jiphomepage/ Medical institutions collaborate to improve mammogram assessment ai. (2020) (Accessed 28 May 2020). https://blogs.nvidia.com/blog/2020/04/15/federated-learning-mammogram-assessment/ Healthchain consortium. (2020) (Accessed 28 May 2020). https://www.substra.ai/en/healthchain-project The federated tumor segmentation (fets) initiative. (2020) (Accessed 28 May 2020). https://www.fets.ai Machine learning ledger orchestration for drug discovery. (2020). Accessed 28 May 2020. https://cordis.europa.eu/project/id/831472 Konečny`, J., McMahan, H. B., Ramage, D. & Richtárik, P. Federated optimization: Distributed machine learning for on-device intelligence. (2016). arXiv preprint arXiv:1610.02527 Lalitha, A., Kilinc, O. C., Javidi, T. & Koushanfar, F. Peer-to-peer federated learning on graphs. (2019). arXiv preprint arXiv:1901.11173 Li, T., Sahu, A. K., Zaheer, M., Sanjabi, M., Talwalkar, A. & Smith, V. Federated optimization in heterogeneous networks. (2018). arXiv preprint arXiv:1812.06127 Zhao, Y. et al. Federated learning with non-iid data. (2018). arxivabs/1806.00582 Li, X., Huang, K., Yang, W., Wang, S. & Zhang, Z. On the convergence of fedavg on non-IID data. (2020). https://openreview.net/forum?id=HJxNAnVtDS Wu, B. et al. P3sgd: patient privacy preserving SGD for regularizing deep CNNs in pathological image classification. In (pp. 2099–2108) (2019). Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition Zhu, L., Liu, Z. & Han, S. Deep leakage from gradients. In Wallach, H. M. et al. (eds) , 14747–14756. (2019). Advances in Neural Information Processing Systems 32: Annual Conference on Neural Information Processing Systems http://papers.nips.cc/paper/9617-deep-leakage-from-gradients Wang, Z. et al. Beyond inferring class representatives: user-level privacy leakage from federated learning. In 2512–2520. (IEEE, Paris, France, 2019). 2019 {IEEE} Conferenceon Computer Communications, {INFOCOM} https://doi.org/10.1109/INFOCOM.2019.8737416 Hitaj, B., Ateniese, G. & Perez-Cruz, F. Deep models under the gan: information leakage from collaborative deep learning. In , CCS’17, 603–618 (Association for Computing Machinery, New York, NY, USA, 2017). Proceedings of the 2017 ACM SIGSAC Conference on Computer and Communications Security Ghorbani, A. & Zou, J. Data shapley: Equitable valuation of data for machine learning. In (pp. 2242-2251) (2019). International Conference on Machine Learning मान्यताएं इस काम को मूल्य-आधारित स्वास्थ्य देखभाल के लिए यूके अनुसंधान और नवाचार लंदन मेडिकल इमेजिंग और कृत्रिम बुद्धि केंद्र द्वारा समर्थित किया गया है, Wellcome / EPSRC केंद्र मेडिकल इंजीनियरिंग (WT203148/Z/16/Z), Wellcome फ्लैगशिप प्रोग्राम (WT213038/Z/18/Z), राष्ट्रीय स्वास्थ्य संस्थानों (NIH) क्लिनिक सेंटर के इंट्रामोरल रिसर्च प्रोग्राम (प्रोजेक्ट "विश्वसनीय संघीय डेटा विश्लेषण") और जर्मन अकादमिक एक्सचेंज सर्विस (DAAD) के राष्ट्रीय कैंसर संस्थान द्वारा पुरस्कार संख्या U01CA242871 के तहत, जर्मन संघीय शिक्षा और अनुसंधान मंत्रालय (B यह दस्तावेज़ CC by 4.0 Deed (Attribution 4.0 International) लाइसेंस के तहत प्रकृति में उपलब्ध है। यह दस्तावेज़ CC by 4.0 Deed (Attribution 4.0 International) लाइसेंस के तहत प्रकृति में उपलब्ध है।