ავტორი : NICOLA რკინი Jonny Hancox მენიუ ჯიშები Li ფუტო Milletarì HOLGER R. ROH Shadi Albarqouni Spyridon ბაკას Mathieu N. Galtier დასაწყისში Bennett A. ლიდმონი კრუს Maier-Hein პორტატორი Ourselin Micah Sheller RONALD M. SUMMERS Andrew ტრაკი Daguang შუ მაქსიმლინი ბოსტ მთავარი > Jorge Cardoso ავტორი : NICOLA რკინი Jonny Hancox მენიუ ჯიშები Li ფუტო Milletarì HOLGER R. ROH Shadi Albarqouni Spyridon ბაკას Mathieu N. Galtier დასაწყისში Bennett A. ლიდმონი კრუს Maier-Hein პორტატორი Ourselin MICAH SHELLER RONALD M. SUMMERS Andrew ტრაკი Daguang შუ მაქსიმლინი ბოსტ მთავარი > Jorge Cardoso Abstract პოსტი მონაცემთა საავტომობილო სასწავლო (ML) გამოჩნდა, როგორც სასურველი ხელმისაწვდომობის მიზნით, რათა შექმნათ სწორი და ძლიერი სტატისტიკური მოდელები სამედიცინო მონაცემებისგან, რომელიც თანამედროვე ჯანმრთელობის სისტემები უზარმაზარი ზომით მოკლეა. მოდული სამედიცინო მონაცემები არ არის სრულიად გაუმჯობესებული ML ძირითადად, რადგან მას მდებარეობს მონაცემთა silos და კონფიდენციალურობის საკითხები შეზღუდავს ხელმისაწვდომობის ამ მონაცემებს. თუმცა, გარეშე ხელმისაწვდომობის საკმარისი მონაცემები, ML იქნება თავიდან ავიცილოთ მისი სრული პოტენციას და, საბოლოოდ, გააკეთოს გადაზიდვა კვლევის კლინიკური პრაქ კონტაქტი კვლევა ხელოვნური ინტელექტურობის (AI) შესახებ, და განსაკუთრებით მოვლენები მანქანული სასწავლო (ML) და Deep Learning (DL) შესახებ თანამედროვე DL მოდელები მოიცავს მილიონობით პარამეტრები, რომლებიც უნდა გაიგო საკმარისი დიდი კურრირებული მონაცემთა კომპლექტი, რათა მიიღოს კლინიკური დონეზე სიზუსტით, ხოლო უსაფრთხოა, ბედნიერი, ბედნიერი და გააუმჯობესება კარგად მახასიათებელი მონაცემებს , , , . 1 2 3 4 5 მაგალითად, სასწავლო AI დაფუძნებული ტუმბოს დეტატორი მოითხოვს დიდი მონაცემთა ბაზა, რომელიც მოიცავს სრული სპექტრი შესაძლებელი ანატომის, პოლოგია, და input მონაცემთა ტიპის. მონაცემები, როგორიცაა ეს, რთულია მიიღოს, რადგან ჯანმრთელობის მონაცემები არის მაღალი სიზუსტით და მისი გამოყენება მკაცრად რეგულარულია. მიუხედავად იმისა, რომ მონაცემთა ანონიმიზაცია შეუძლია ამ შეზღუდვები შეუზღუდავი, ახლა კარგად აღიარებულია, რომ პაციენტის სახელი ან თარიღი ხშირად არ არის საკმარისი კონფიდენციალურობის დაცვისთვის. ეს შესაძლებელია, მაგალითად, reconstruct a patient's face from computed tomography (CT) or magnetic resonance imaging (MRI) მონაცემები სხვა მიზეზით, რომ მონაცემთა გაზიარება არ არის სისტემური ჯანმრთელობში, არის, რომ მაღალი ხარისხის მონაცემთა კომპლექტი მოკლე დრო, ეფექტურობა და ღირებულება. მას შემდეგ, რაც ასეთი მონაცემთა კომპლექტი შეიძლება იყოს მნიშვნელოვანი ბიზნეს ღირებულება, რაც ნაკლებად იძლევა, რომ ისინი თავისუფლად გაზიარება. გარდა ამისა, მონაცემთა კომპლექტი ხშირად შეინარჩუნებს ფანტასტიკური კონტროლი მონაცემებს, რომლებიც მათ მოკლეა. 6 7 8 Federated Learning (FL) - ფანჯარული კვლევები , , ეს არის სასწავლო პარამეტრი, რომელიც ეძებს მონაცემთა მართვის და კონფიდენციალურობის პრობლემის გადაწყვეტა, აწარმოოს ალგორტატები თანამშრომლად გარეშე მონაცემების ცვლილება. ორიგინალური განვითარებული სხვადასხვა დონეზე, როგორიცაა მობილური და Edge მოწყობილობების გამოყენების შემთხვევაში , ეს ბოლოში მიიღო მოცულობა ჯანმრთელობის პროგრამები , , , , , , , FL საშუალებას იძლევა შეკუმშვის მიღება თანამშრომლად, მაგალითად, შეკუმშვის მოდელი ფორმაში, არასამთავრობო პაციენტების მონაცემების გადაზიდვა იმ ინსტიტუტებს, სადაც ისინი მდებარეობს. გარდა ამისა, ML პროცესი ხდება ადგილობრივ თითოეული მონაწილეობის ინსტიტუტაში და მხოლოდ მოდელი თვისებები (გალითად, პარამეტრები, gradients) გადაცემა, როგორც ჩანს Fig. უახლესი კვლევა აჩვენა, რომ FL- ის ტრენინგი მოდელები შეუძლიათ შეესაბამება შესრულების დონეზე, რომელიც შეესაბამება მათ, რომლებიც ტრენინგილი centrally-hosted მონაცემთა კომპლექტი და უმაღლესი მოდელები, რომლებიც მხოლოდ იზოლებული ერთი ინსტიტუტური მონაცემები. , . 9 10 11 12 13 14 15 16 17 18 19 20 1 16 17 FL- ის შეერთებული სერვერები – ტიპიური FL- ის სამუშაო თარგმანი, სადაც ტრენინგი ნომრები მიიღებენ გლობალური მოდელი, შეუზღუდავი დროში შეუზღუდავი დროში შეუზღუდავი დროში შეუზღუდავი დროში შეუზღუდავი დროში შეუზღუდავი დროში შეუზღუდავი დროში შეუზღუდავი დროში შეუზღუდავი დროში შეუზღუდავი დროში შეუზღუდავი დროში შეუზღუდავი დროში შეუზღუდავი დროში შეუზღუდავი დროში შეუზღუდავი დროში შეუზღუდავი დროში შეუზღუდავი დროში შეუზღუდა FL peer to peer — alternative formulation of FL, სადაც თითოეული სასწავლო ნომერი გაუზიარებს მისი ნაწილად სასწავლო მოდელები ზოგიერთი ან ყველა მისი პარტნიორები და თითოეული გააკეთებს საკუთარი შეფუთვა. ჩრდილოეთ ტრენინგი — საერთო არ-FL ტრენინგი სამუშაო თარგმანი, სადაც მონაცემების მიღების საიტები მათი მონაცემებს ცენტრირებული მონაცემთა ხეზე, სადაც მათ და სხვები შეუძლიათ მონაცემები ადგილობრივი, დამოუკიდებელი ტრენინგი. a b c მას შემდეგ, რაც FL- ის წარმატებული განახლება შეუძლიათ გაძლევთ პოტენციური პოტენციალი ზუსტი მედიცინის გაძლევას დიდი ზომით, რაც მოდულებს გაძლევთ უარყოფითი გადაწყვეტილებები, ინდივიდუალური ფსიქოლოგია უამრავი ხელს უწყობს და რთული დაავადებების თავმჯდომარეა, ხოლო კონფიდენციალურობის და კონფიდენციალურობის მნიშვნელობა შეესაბამება. თუმცა, FL- ს ჯერ კიდევ საჭიროა მკაცრი ტექნიკური მიმოხილვა, რათა უზრუნველყოს, რომ ალგორტიმი ოპტიმიზირებულია უსაფრთხოების ან პაციენტების კონფიდენციალურობის შეზღუდვის გარეშე. ჩვენ ვფიქრობ, რომ ციფრული ჯანმრთელობის მომავალში შეუერთდება და ამ პროგნოზი პრაქტიკა, ჩვენ ვთქვათ, რომ ჩვენი კონტექსტი და დეტალების უზრუნველყოფა საზოგადოებას ფსიქიკური განაცხადებისთვის FL- ის უპირატესობების და ეფექტების შესახებ (სექცია "Data-driven medicine requires federated efforts"), ისევე როგორც ფოკუსირება ციფრული ჯანმრთელობისთვის FL- ის განხორციელების ძირითადი მიმოხილვა და მოვლენები (სექცია "Technical considerations"). Data-driven სამედიცინო მოითხოვს Federated ინსტრუმენტები ML და განსაკუთრებით DL ხდება de facto ცოდნა მოპოვების ხელმისაწვდომობა მრავალი ინდუსტრიაში, მაგრამ წარმატებული განხორციელება მონაცემების მორგებული პროგრამები მოითხოვს დიდი და მრავალფეროვანი მონაცემთა კომპლექტი. თუმცა, სამედიცინო მონაცემთა კომპლექტი ძალიან რთულია მიიღოს (დაწვრილებით “დაწვრილებით მონაცემებს”). FL ამ პრობლემას გადაიხადოს, რათა საშუალებას გაძლევთ თანამშრომლობის სასწავლო გარეშე ცენტრიზაციის მონაცემები (დაწვრილებით “დაწვრილებით Federated ინსტრუმენტები”) და უკვე აღმოაჩინეს გზა ციფრული ჯანმრთელობის პროგრამები (დაწვრილებით “დაწვრილებით FL ინსტრუმენტები ციფრული ჯანმრთელობის”). მონაცემთა დამოკიდებულება მონაცემთა ეფუძნებული მიმოხილვა ეფუძნებულია მონაცემებს, რომლებიც ნამდვილად შეიცავს პრობლემის ძირითადი მონაცემთა გაფართოებას. მიუხედავად იმისა, რომ ეს არის ცნობილი მოთხოვნები, თანამედროვე ალგორტიმებს ზოგადად შეფასებენ მკაცრად შეკუმშული მონაცემთა კომპლექტი, ხშირად მხოლოდ რამდენიმე წყაროდან. ეს შეიძლება შეიცვალოთ ფსიქოლოგია (მაგ. სქესა, ასაკი) ან ტექნიკური უარყოფილება (გ.გ. მოკლეპტოტოკოლი, აღჭურვილობა მწარმოებელი) შეკუმშოს პროგნოზიები და უარყოფითად ეფუძნებს გარკვეული ჯგუფიების ან საიტის სიზუსტით. თუმცა, განიცდილი ურთიერთობების მო დიდი მონაცემთა ბაზების საჭიროება ინტელექტუალური ინტელექტუალური ტრენინგისთვის მრავალფეროვანი ინტელექტუალური ინტელექტუალური ინტელექტუალური მონაცემების ერთობლივებას განიხილავს. ეს მონაცემები ხშირად აერთიანებენ, როგორც ცნობილია, როგორც მონაცემთა მაკები. ეს იყო შექმნილია, რათა გამოიყენოთ მონაცემების კომერციული ღირებულება, მაგალითად, IBM- ის Merge Healthcare- ის გაყიდვა. , ან ეკონომიკური ზრდის და მეცნიერების გაუმჯობესების წყარო, მაგალითად, NHS Scotland's National Safe Haven საფრანგეთის ჯანმრთელობის მონაცემთა Hub Health Data Research ბრიტანეთი . 21 22 23 24 ძირითადი, მიუხედავად იმისა, რომ მცირე, ინტივაცია მოიცავს Human Connectome დიდი ბრიტანეთი Biobank Cancer Imaging Archive (TCIA) საინფორმაციო დოკუმენტები NIH CXR8 NIH DeepLesion Cancer Genome Atlas (TCGA) - ქსოვილის გენომის Atlas (TCGA) Alzheimer’s Disease Neuroimaging Initiative (ADNI) საინფორმაციო პროგრამა სამედიცინო კვლევების დიდი მოთხოვნები Camelyon Challenge-ის მოვლენები BRATS (International Multimodal Brain Tumor Segmentation) - საერთაშორისო multimodal ტვინის ტვინის Segmentation (BRATS) მოვლენები , , სამედიცინო Segmentation Decathlon საზოგადოებრივი სამედიცინო მონაცემები, როგორც წესი, ფუნქციონალური ან დაავადების სპეციფიკაციურია და ხშირად გამოქვეყნდა სხვადასხვა დონეზე ლიცენზია შეზღუდვები, ზოგჯერ შეზღუდვა მისი გაუმჯობესება. 25 26 27 28 29 30 31 32 33 34 35 36 37 Centralising or releasing data, however, poses not only regulatory, ethical and legal challenges, related to privacy and data protection, but also technical ones. Anonymising, controlling access and safely transferring healthcare data is a non-trivial, and sometimes impossible task. Anonymised data from the electronic health record can appear innocuous and GDPR/PHI compliant, but just a few data elements may allow for patient reidentification იგივე ნიშნავს genomic მონაცემები და სამედიცინო სურათები, რაც მათ უნიკალური, როგორც fingerprint. მას შემდეგ, რაც მონაცემების ანონიმაციის პროცესი შეუზღუდავს მონაცემების სიტყვას, რომელიც შეიძლება გამოიწვიოს, პაციენტების რედაქტირება ან მონაცემთა გაქირავება არ შეიძლება შეუზღუდავი იყოს. იმიტომ, რომ მონაცემების ხელმისაწვდომობის შეზღუდავი გაზღუდავი გაზღუდავი გაზღუდავი გაზღუდავი გაზღუდავი გაზღუდავი გაზღუდავი გაზღუდავი გაზღუდავი გაზღუდავი გაზღუდავი გაზღუდავი გაზღუდავი გაზღუდავი გაზღუდავი გაზღუდავი გაზღუდავი გაზღუდავი გაზღუდავი 7 38 კონფიდენციალურობის შეთავაზება FL- ის გარიგება არის მარტივი – კონფიდენციალურობის და მონაცემთა მართვის მოთხოვნილებთან დაკავშირებით ML- ის საშუალებას გაძლევთ არასამთავრობო კონფიდენციალურობის მონაცემებისგან. FL- ში, თითოეული მონაცემთა კონტროლერი არა მხოლოდ საკუთარი კონფიდენციალურობის პროცესებს და დაკავშირებული მონაცემთა კონფიდენციალურობის პოლიტიკას აირჩიებს, არამედ კონტროლებს მონაცემების ხელმისაწვდომობას და აქვს შესაძლებლობებს, რათა მას გაქირავდეს. ეს მოიცავს ორივე ტრენინგი, ისევე, როგორც კონფიდენციალურობის ფაზა. ამ გზით, FL- ს შეუძლია ახალი შესაძლებლობები შექმნათ, მაგალითად, ფართო ზომის, საინფორმაციო კონფიდენციალურობის საშუალებას როგორც ჩანს Fig. ფოლადის ფოლადის ფოლადის ფოლადის ფოლადის ფოლადის ფოლადის ფოლადის ფოლადის ფოლადის ფოლადის ფოლადის ფოლადის ფოლადის ფოლადის ფოლადის ფოლადის ფოლადის ფოლადის ფოლადის ფოლადის ფოლადის ფოლადის ფოლადის ფოლადის ფოლადის ფოლადის ფოლადის ფოლადის ფოლადის ფოლადის ფოლადის ფოლადის ფოლადის ფოლადის ფოლადის ფოლადის ფოლადის ფოლადის ფოლადის ფოლადის ფოლადის ფოლადის ფოლადის ფოლადის ფოლადის ფოლადის ფოლადის ფოლადის ფოლ , , Peer to Peer მიმოხილვა , ყველა შემთხვევაში, FL implicitly გთავაზობთ გარკვეული დონის კონფიდენციალურობის, რადგან FL მონაწილეები არასდროს პირდაპირი ხელმისაწვდომობა მონაცემები სხვა ინსტიტუტების და მხოლოდ მიიღოს მოდელის პარამეტრები, რომლებიც შეუერთდა რამდენიმე მონაწილეებს. In a FL workflow with aggregation server, participating institutions can even remain unknown to each other. however, it has been shown that the models themselves can, under certain conditions, memorize information , , , ასე რომ, მექანიზმი, როგორიცაა განსხვავებული კონფიდენციალურობის , ან კვლევები კრეპტირებული მონაცემთაგან, რათა დამატებით გაუმჯობესოს კონფიდენციალურობის ფორმირება FL- ში (გ.შ. ნაწილაკს “Technical considerations”). საერთოდ, FL- ის პოტენციები ჯანმრთელობის განაცხადებისათვის შეხვდა საზოგადოებას. და FL ტექნიკა იზრდება კვლევის ფართობი , . 2 16 17 18 15 39 40 41 42 43 44 45 46 12 20 FL topologies — კომუნიკაციის არქიტექტურა Federation. Centralized: შეფუთვა სერვერზე შეესაბამება სასწავლო განახლებები და მოკლე, შეფუთვა და გადაზიდვა მოდელები და სასწავლო Nodes (Hub & Spoke). Decentralized: თითოეული სასწავლო ღონისძიება დაკავშირებულია ერთ-ერთი ან მრავალი პარტნიორთან და ერთ-ერთი ღონისძიება შეუერთდება. გეერარკული: federated ქსელები შეიძლება შეიცავდეს რამდენიმე ქვეშ-ფრედიტაცია, რომელიც შეიძლება შეიცავდეს Peer-to-Peer და Aggregation Server Federations ( FL კომპიუტერული გეგმა — მოდელის გზა რამდენიმე პარტნიორზე. ციკლიური გადაზიდვის სასწავლო / Cyclic Transfer Learning. კონტაქტი სერვერზე, Peer და Peer. a b c d e f g ამჟამად ფოლადის ეფექტურობა ციფრული ჯანმრთელობისთვის მას შემდეგ, რაც FL არის საერთო სასწავლო პარამეტრი, რომელიც იღებს მონაცემთა შეერთების მოთხოვნას AI მოდულების განვითარებისთვის, FL- ის განაცხადის სპექტრი მოიცავს ყველა AI- ის ჯანმრთელობისთვის. მასთან ერთად, რაც შესაძლებლობა გაძლევთ უფრო დიდი მონაცემთა განსხვავება და პაციენტების ანალიზი სხვადასხვა დეტალები, FL- ს შეიძლება გაძლევთ უარყოფითი ინოვაციები მომავალში, მაგრამ ახლა ასევე გამოიყენება. ელექტრონული ჯანმრთელობის დოკუმენტების (EHR) კონტაქტში, მაგალითად, FL ხელს უწყობს კლინიკურად მსგავსი პაციენტების რეპუტაცია და იპოვებას. , , ისევე, როგორც განიხილება საავადმყოფილების მიზეზით გულის მოვლენები დასაწყისში დასაწყისში დასაწყისში FL- ის გამოყენება და უპირატესობები აჩვენა ასევე სამედიცინო სურათების ფართობი, მთელ ტვინის segmentation in MRI- სთვის. , ისევე როგორც ტვინის ტვინის segmentation , უახლესი დროს, ტექნიკა გამოიყენება fMRI კლასიკისთვის, რათა იპოვოს საიმედო დაავადების დაკავშირებული biomarkers. და შეთავაზება, როგორც შეთავაზება კონტაქტში COVID-19 . 13 47 14 19 15 16 17 18 48 მნიშვნელოვანია, რომ FL- ის ეფექტებს მოითხოვს კონტაქტები, რათა დააყენოთ მოცულობა, მიზნები და ტექნოლოგიები, რომლებიც, რადგან ეს ჯერ კიდევ ახალია, შეიძლება იყოს რთული დაინახოთ. ამ კონტაქტში, დღესის ფართო მოწყობილობები ნამდვილად ხელსაყრელი ხელსაყრელი ხელსაყრელი ხელსაყრელი ხელსაყრელი ხელსაყრელი ხელსაყრელი ხელსაყრელი ხელსაყრელი ხელსაყრელი. ეს მოიცავს კუნძულებს, რომლებიც მიზნად გააუმჯობესებენ Trustworthy Federated Data Analytics (TFDA) პროექტი German Cancer Consortium- ის საერთო სურათების პლატფორმა გერმანიის სამედიცინო სურათების კვლევითი ინსტიტუტებში, რომელიც საშუალებას იძლევა დეტალური კვლევა. კიდევ ერთი მაგალითია საერთაშორისო კვლევითი თანამშრომლობა, რომელიც იყენებს FL- ს AI- ის მოდულების განვითარება mammograms- ის კვლევისთვის. სტრუქტურა აჩვენა, რომ FL-გვერდირებული მოდელები გაუმჯობესესდა ერთ-ერთი ინსტიტუტის მონაცემების შესახებ და უფრო გაფართოებული იყო, ასე რომ ისინი ჯერ კიდევ კარგად შეესაბამება სხვა ინსტიტუტის მონაცემებს. თუმცა, FL არ შეზღუდულია მხოლოდ სტრუქტურებში. კლასიკური 49 50 51 კავშირი ჯანმრთელობის ინსტიტუტები, რომელიც არ შეზღუდულია კვლევითი ცენტრი, FL შეუძლია პირდაპირი impact. The ongoing HealthChain პროექტი , მაგალითად, მიზნით, რათა განვითარდეს და განაყენოთ FL framework across four Hospitals in France. ეს გადაწყვეტილება აწარმოებს საერთო მოდელები, რომლებიც შეუძლია პროგნოზოს მკურნალობის პასუხისმგებლობა breast cancer და melanoma პაციენტები. იგი დაეხმარება oncologists აირჩიოს ყველაზე ეფექტური მკურნალობა თითოეული პაციენტს მათი histology slides ან dermoscopy სურათები. კიდევ ერთი ფართო ფართო მოცულობა არის Federated Tumour Segmentation (FeTS) ინტივაცია , რომელიც არის საერთაშორისო Federation of 30 ინტეგრირებული ჯანმრთელობის ინსტიტუტები გამოყენებით Open-Source FL Framework ერთად გრაფიკული მომხმარებლის ინტერფეისი. მიზანია გაუმჯობესოს ტუმბოს ხაზის აღწერა, მათ შორის ტვინის გლიომას, მშრალი ტუმბოს, თხევადი ტუმბოს და კუნთების დაზიანების მრავალჯერადი myeloma პაციენტები. კლინიკური 52 53 სხვა სფეროებში ეფექტი აქვს კვლევა და ტრანსპორტირება. FL საშუალებას იძლევა თანამშრომლობის კვლევა, მაშინაც კი კონკურენტი, კომპანიები. ამ კონტაქტში, ერთ-ერთი ყველაზე დიდი ინტივაცია არის Melloddy პროექტი ეს არის პროექტი, რომელიც მიზნად აწარმოებს მრავალფუნქციური FL- ს 10 pharmaceutical კომპანიის მონაცემთა კომპლექტიებში. საერთო პროგნოზიული მოდელი, რომელიც მიუთითებს, თუ როგორ ქიმიური კომპლექტი შეესაბამება ცილის, პარტნიორები გსურთ გაუმჯობესოთ ნარკოტიკების აღმოაჩინების პროცესს, არასამთავრობო მათი მაღალი ღირებულება ინტენსიური მონაცემები. სამრეწველო 54 კონფიდენციალურობის მოვლენები FL მოიცავს paradigm shift from centralized data lakes და მნიშვნელოვანია, რომ იცოდეთ მისი ეფექტი სხვადასხვა პარტნიორებს FL ekosystem. კლინიკები როგორც წესი, კლინიკატორები პოპულარული დოქროპოლიტაციაზე შეესაბამება იყენებენ მათი ადგილობრივ და დეპოლიტური გარემოში, რაც შეიძლება იწვევს გარკვეული დაავადების რეზოლუციას ან მათი ურთიერთობა. ML-based სისტემების გამოყენებით, მაგალითად, როგორც მეორე წერილი, მათ შეუძლიათ მათი საკუთარი გამოცდილება სხვა ინსტიტუტების სპეციფიკაციით გაუმჯობესოს, რათა უზრუნველყოს დოკუმენტული დიაგნოზი, რომელიც დღეს არ არის შესაძლებელი. მიუხედავად იმისა, რომ ეს გამოიყენება ML-based სისტემაში ზოგადად, federated გზა ტრენინგიული სისტემები შესაძლებელია უფრო ნაკლებად შეესაბამებული გადაწყვეტილებები და უფრო მაღალი ინტენსიურობისთვის, რადგან ისინი შეიძლება იყოს შეესაბამ პაციენტები პაციენტებს ჩვეულებრივ ადგილობრივ მკურნალობა. FL- ის შექმნა გლობალური სიზუსტით შეიძლება უზრუნველყოს მაღალი ხარისხის კლინიკური გადაწყვეტილებები, მიუხედავად იმისა, რომ მკურნალობა მდებარეობს. განსაკუთრებით, პაციენტებს, რომლებიც მოითხოვს სამედიცინო დახმარება გარშემო რეგიონებში, შეუძლიათ სარგებლობენ იგივე მაღალი ხარისხის ML- ის მხარდაჭერა დიაგნოზები, რომლებიც ხელმისაწვდომია სასტუმროებში დიდი რაოდენობით შემთხვევაში. იგივე იმას ნიშნავს, რომ რთული ან geographically ცუდი, მკურნალობა, რომელიც შესაძლებელია შეუზღუდავი შედეგები, თუ სწრაფად და უფრო ზუსტი დიაგნოზები შეიძლება გაკეთდეს. FL- ის ასევე შეიძლება შეამციროს დონ Hospitals და პრაქტიკები სამზარეულო და პრაქტიკა შეიძლება იყოს სრული კონტროლი და possession მათი სამზარეულო მონაცემების სრული მოცულობა მონაცემების ხელმისაწვდომობის, შეზღუდოს რისკი ცუდი გამოყენების მიერ თარიღი. თუმცა, ეს მოითხოვს ინვესტიციები on-premise კომპიუტერული ინფრასტრუქტურის ან პირადი cloud მომსახურების უზრუნველყოფა და შეესაბამება სტანდარტული და სინოპტიკური მონაცემთა ფორმატები, ასე რომ ML მოდელები შეუძლია ტრენინგი და შეფასება საბაჟო. რაოდენობა საჭირო კომპიუტერული შესაძლებლობები დამოკიდებულია, რა თქმა უნდა, თუ საიტზე მხოლოდ მონაწილეობს შეფასების და ტესტირების ეფექტების ან ასევე სასწავლო ეფექტების. მიუხედავად იმისა, კვლევითი და AI Developer კვლევები და AI განვითარებლები ხელმისაწვდომია პოტენციურად ფართო კოლექცია რეალურ მსოფლიოში მონაცემების, რომელიც, რა თქმა უნდა, ეფექტი მცირე კვლევითი ლაბორატორიები და საწყისი საწარმოები. ასე, რესურსები შეიძლება გადარჩენა კლინიკური საჭიროებებს და დაკავშირებული ტექნიკური პრობლემები, ვიდრე დამოკიდებულება შეზღუდული მიწოდების ღია მონაცემთა კომპლექტი. ამავე დროს, აუცილებელია კვლევა ალგორტული სტრატეგიები federated სასწავლო, მაგალითად, როგორ შეუერთოს მოდელები ან განახლება ეფექტურად, როგორ იყოს ძლიერი გადაზიდვის გადაზიდვა. , , FL-based განვითარება ასევე მოიცავს, რომ კვლევითი ან AI Developer არ შეუძლია კვლევა ან ვიზუალური ყველა მონაცემები, სადაც მოდელი სასწავლო, მაგალითად, ეს არ არის შესაძლებელი, რომ შეამოწმოთ ინდივიდუალური ცუდი შემთხვევაში, რათა შეინახოთ, რატომ მიმდინარე მოდელი არ მუშაობს მას. 11 12 20 ჯანმრთელობის მომწოდებლები მრავალი ქვეყნებში ჯანმრთელობის მომსახურების მომსახურების მომწოდებლები გავლენას შეუზღუდავი პარამეტრების გადაზიდვა მოცულობის დაფუძნებული, მაგალითად, საფასური მომსახურების დაფუძნებული, ღირებულება დაფუძნებული ჯანმრთელობის მომსახურების, რომელიც, როგორც წესი, ძლიერი დაკავშირებულია წარმატებული დაარსების სიზუსტით მედიცინის. ეს არ არის გამოწვევა უფრო ღირებულ ინდივიდუალური მკურნალობა, არამედ უფრო სწრაფად მიღების უკეთესი შედეგები უფრო ფოკუსირებული მკურნალობა, ამით შეამციროს ღირებულება. FL აქვს პოტენციურად გაზრდის სიზუსტით და robustness ჯანმრთელობის AI, ხოლო შეამციროს ღირებულება და გაუმჯობესოს პაციენტ წარმოების ჯანმრთელობის პროგრამული უზრუნველყოფის და ტექნოლოგიების მწარმოებლები ასევე შეუძლიათ ხელმისაწვდომია FL- ს, რადგან მრავალფეროვანი მოწყობილობების და აპლიკაციების გაერთიანება, პაციენტის სპეციფიკაციური ინფორმაციის გამოხატვა გარეშე, შეიძლება დაეხმაროს მათი ML-based სისტემების მუდმივი გაფართოებას ან გაუმჯობესებას. თუმცა, ასეთი შესაძლებლობა შეიძლება მოითხოვოს ადგილობრივი კომპიუტერის, მონაცემთა შენახვის, ქსელის შესაძლებლობების და დაკავშირებული პროგრამული უზრუნველყოფის მნიშვნელოვანი გაუმჯობესებას. ტექნიკური მიმოხილვა FL- ის ყველაზე ცნობილია Konečnỳ et al-ის სამუშაოები. , მაგრამ მრავალფეროვანი სხვა განახლებები უკვე გთავაზობთ Literature , , , A FL workflow (მაგ. ) შეიძლება განახლდეს სხვადასხვა ტოპოლოგია და კომპიუტერული გეგმები (მაგ. ამ სექციაში, ჩვენ განიხილავთ უფრო დეტალურად, რა არის FL, ისევე, როგორც აღსანიშნავია ძირითადი მოთხოვნები და ტექნიკური შეზღუდვები, რომლებიც გამოწვეულია, როდესაც გამოყენება FL ციფრული ჯანმრთელობის. 55 9 11 12 20 1 2 Federated სწავლის განხორციელება FL არის სასწავლო პარამეტრი, სადაც მრავალფეროვანი პარტნიორები თანამშრომლად ტრენინგი არ უნდა გაუზიაროთ ან ცენტრიზოს მონაცემთა კომპლექტი. FL- ის საერთო ფორმირება წაიკითხა, როგორც შემდეგი: Let denote a global loss function obtained through a weighted combination of ადგილობრივი დაკარგვა, გამოხატული პირადი მონაცემები , რომელიც მდებარეობს ინდივიდუალური დაკავშირებული პარტნიორები და არ გაუზიარებს მათ შორის: K XK როგორ > 0 აჩვენებს respective წონა კოდექსი. WK პრაქტიკაში, თითოეული მონაწილე ჩვეულებრივ მიიღებს და გააუმჯობესებს გლობალური კმაყოფილების მოდელი, გააკეთა რამდენიმე ნაბიჯების გაუმჯობესება ადგილობრივ და წინასწარ გაზიარება განახლებები, პირდაპირი ან მეშვეობით პარამეტრების სერვერზე. ) , ფუნქციური პროცესი შეერთების პარამეტრები დამოკიდებულია ქსელის ტოპოლოგია, რადგან ღონისძიებები შეიძლება იყოს სექციონირებული დისკსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსსს. ). შეფუთვა სტრატეგიები შეიძლება დამოკიდებული იყოს ერთი შეფუთვა ღილაკს (hub და spoke მოდელები), ან მრავალფეროვანი ღილაკები გარეშე ნებისმიერი ცენტრიზაცია. მაგალითად, peer-to-peer FL, სადაც კავშირები არსებობს ყველა ან ნომერი პარტნიორები და მოდელი განახლებები გაზიარება მხოლოდ პირდაპირი დაკავშირებული საიტები , 1 ალგორტიმში განიხილება, რომ ალგორტიზაციის სტრატეგიები არ უნდა მოითხოვოს მონაცემებს სრული მოდელის განახლებაზე; კლიენტები შეიძლება აირჩიოთ მხოლოდ მოდელის პარამეტრების ნომერი, რათა შეამციროს კომუნიკაციის ზედაპირზე, უზრუნველყოს უკეთესი კონფიდენციალურობის დაცვა. ან აწარმოოს მრავალფუნქციური სასწავლო ალგორტიზები, რომლებიც მხოლოდ ნაწილი მათი პარამეტრების გაიგო Federated გზა. 1 9 12 2 15 56 10 ერთობლივი Framework, რომელიც საშუალებას გაძლევთ სხვადასხვა სასწავლო სისტემები შეიძლება გათავისუფლოს კომპიუტერული რესურსები (დაწვრილებით და სერვერები) როგორც ჩანს Fig. მას შემდეგ, რაც მოდელი შეიცავს რამდენიმე პარტნიორს, ეს მოდელი უნდა იყოს სასწავლო და შეფასებული კონკრეტული მონაცემთა კომპლექტი. კომპიუტერული გეგმა 2 Challenges და მიმოხილვა FL- ის უპირატესობების მიუხედავად, ეს არ გადაიხადოს ყველა პრობლემები, რომლებიც სამედიცინო მონაცემების კვლევთან დაკავშირებული არიან. წარმატებული მოდელის სასწავლო ჯერ კიდევ დამოკიდებულია მონაცემთა ხარისხის, შედუღების და სტანდარტაციის მაგალითად. ამ საკითხებს უნდა გადაიხადოს ორივე ფანჯარული და არა ფანჯარული სასწავლო მოცულობისთვის, როგორიცაა ზუსტი კვლევების დიზაინი, საერთო პროტოკები მონაცემების მოპოვებლად, სტრუქტურული ანგარიშები და მოწინავე მედიკამენტები ფსიქიკური და შეკუმშული სტრუქტურების აღმოჩენა. ქვემოთ, ჩვენ შეხვდება FL- ის ძირითადი მოთხოვნებს, რომლებიც განსაკუთრებით მნიშვნელოვანია ციფრული ჯანმრთელობის გამოყენებისას და უნდა გაითვალისწინოთ FL- ის შექმნისას. ტექნიკური დეტალები და დეტალები და დეტალები განიხილება, ჩვენ ვხედავ უახლესი კვლევებს. , , . 2 11 12 20 მონაცემთა heterogeneity სამედიცინო მონაცემები განსაკუთრებით მრავალფეროვანია – არა მხოლოდ მოდულების, dimensionality და თვისებების მრავალფეროვნება, არამედ კონკრეტული პროტოკოლში, როგორიცაა მოპოვების განსხვავებები, სამედიცინო მოწყობილობის ბრენდის ან ადგილობრივი დომგრაფიის გამო. FL შეიძლება დაეხმაროს ზოგიერთი საგანგებო სიგნალების გაუმჯობესების საშუალებით მონაცემთა წყაროების მრავალფეროვნება, მაგრამ უსიამოვნო მონაცემთა გაფართოება აპირებს FL ალგორტატები და სტრატეგიები, რადგან ბევრი იღებს დამოუკიდებლად და იგივეად გაფართოებული (IID) მონაცემები მონაწილეებში. საერთოდ, სტრატეგიები, როგორიცაა: ამ პირობებში ცუდი იქნება , , , ზოგიერთი განკუთვნილია თანამშრომლობის სასწავლო სტრატეგიების მიზანია. ახალი შედეგები, თუმცა, აჩვენებენ, რომ FL სასწავლო ჯერ კიდევ შესაძლებელია , მიუხედავად იმისა, რომ სამედიცინო მონაცემები არ არის ერთდროულად გაფართოებული უნივერსიტეტებში , ან მოიცავს ადგილობრივი bias კვლევები ამ საკითხზე მოიცავს, მაგალითად, Part-data-sharing სტრატეგია და FL ერთად domain-adaptation სხვა პრობლემა არის, რომ მონაცემთა ჰეტეროგენეტიკა შეიძლება გამოიწვიოს სიტუაციაში, სადაც გლობალური ოპტიმალური გადაწყვეტილება შეიძლება არ იყოს ოპტიმალური თითოეული ადგილობრივი მონაწილეზე. მოდელის სასწავლო ოპტიმიზაციის განთავსება, ამიტომ, უნდა იყოს შეესაბამებული ყველა მონაწილეებს წინასწარ სასწავლო. ფსონი 9 9 57 58 59 16 17 51 FedProx 57 58 18 კონფიდენციალურობის და უსაფრთხოების ჯანმრთელობის მონაცემები ძალიან სქესობრივია და მათთან დაკავშირებით უნდა იყოს დაცული, შესაბამისად, შესაბამისი კონფიდენციალურობის პროცედურა. ამიტომ, ზოგიერთი ძირითადი მიმოხილვა არის კომფორტები, სტრატეგიები და შემდგომი რისკები, როგორიცაა FL- ის კონფიდენციალურობის დაცვის პოტენციალი. კონფიდენციალურობის vs. შესრულების: მნიშვნელოვანია, რომ FL არ გადაწყვეტა ყველა პოტენციური კონფიდენციალურობის პრობლემები და – როგორც ML ალგორტატები ზოგადად – ყოველთვის შეიცავს ზოგიერთი რისკები. კონფიდენციალურობის შენარჩუნების ტექნოლოგია FL გთავაზობთ დაცვის დონეზე, რომელიც გააუმჯობესებს მიმდინარე კომერციული ხელმისაწვდომი ML მოდელები. თუმცა, ეფექტურობის შესახებ არსებობს კომფორტი და ეს ტექნოლოგია შეიძლება შეხვდეს, მაგალითად, საბოლოო მოდელის სიზუსტით. გარდა ამისა, მომავალი ტექნოლოგიები და / ან მხარდაჭერ მონაცემები შეიძლება გამოყენებულ იქნას, რათა შეუზღუდავი მოდელი, რომელიც ადრე ითვლება დაბალი რისკის. 12 10 კონფიგურაციის დონე: ზოგადად, მონაწილეობა პარტნიორები შეიძლება შეხვდეს ორი ტიპის FL თანამშრომლობა: —Fl კონუსტრიაში, სადაც ყველა პარტნიორები ითვლება Trustworthy და შეუზღუდავი დამუშავებული თანამშრომლობის გარიგება, ჩვენ შეგვიძლია შეუზღუდავი მრავალი უფრო ცუდი მოტივებს, როგორიცაა ცუდი ცუდი ცუდი ცუდი გაქირავება sensitive ინფორმაცია ან ცუდი მოდელი. ეს შეამციროს საჭიროება მოწინავე კონცენტრაციების, დაახლოებით სტანდარტული თანამშრომლობის კვლევის პრინციპები. საიმედო —Fl სისტემები, რომლებიც ფუნქციონირებენ უფრო დიდი ზომით, შეიძლება იყოს უარყოფითი, რომ შექმნათ აღმასრულებელი თანამშრომლობის გარიგება. ზოგიერთი კლიენტები შეიძლება გსურთ შეუზღუდავი შესრულება, სისტემის ქვემოთ დატოვოს ინფორმაცია სხვა პარტნიორებს. ასე რომ, უსაფრთხოების სტრატეგიები უნდა შეამციროს ამ რისკებს, როგორიცაა, მოდელი გადაცემის გაუმჯობესებული კოდიფიკაცია, ყველა პარტნიორების უსაფრთხო დატვირთვა, საქმიანობის მახასიათებლები, განსხვავებული კონფიდენციალურობის, კონფიდენციალურობის სისტემები, შესრულების ინტერფეისი, მოდელი კონფიდენციალურობის და დაცვის არაფერსონალური მონაცემთა გაქირავება: ფოლადის სისტემები შეამციროს ჯანმრთელობის მონაცემების გაზიარება მონაწილეობის ინსტიტუტების შორის. თუმცა, გაზიარებული მონაცემები ჯერ კიდევ შეიძლება პირადი მონაცემებს, რომელიც გამოიყენება ადგილობრივი სასწავლოთვის, მაგალითად, მოდელის შეუზღუდავი. მოდულების განახლებების შესახებ, გრიდიანტები თავს ან კონდიციონერული თავმჯდომარე , FL განსხვავდება ტრენინგის ტრენინგიდან, რადგან ტრენინგის პროცესს მრავალფეროვანი პარტნიორებს შეესაბამება, ამდენად გაზრდის შეზღუდვის რისკები კონვერტაციის მეშვეობით, თუ პარტნიორები შეუძლიათ შეამოწმონ მოდელის ცვლილებებს დროის განმავლობაში, შეამოწმონ კონკრეტული მოდელი განახლება (მაგ. ერთ-ერთი ინსტიტუტის განახლება), ან მოპოვოს მოდელი (მაგ. აწარმოებს სხვა მიერ დამატებითი შეტყობინება გრიდიანტი-სასპლეტის სტილის დატვირთვა). , და უზრუნველყოფს საკმარისი განსხვავებული კონფიგურაცია , შეიძლება იყოს საჭირო და ჯერ კიდევ არის აქტიური კვლევის ტერიტორია . 60 61 62 63 16 18 44 12 Traceability და პასუხისმგებლობა როგორც ყველა უსაფრთხოების მნიშვნელოვანია განაცხადების, სისტემის რეპუტაცია მნიშვნელოვანია FL- ს ჯანმრთელობში. ჩვეულებრივი ტრენინგითან განსხვავებით, FL- ს მოითხოვს მრავალფეროვანი კომპიუტერები გარემოში, რომელიც შეიცავს საკმაოდ მრავალფეროვანი მოწყობილობები, პროგრამული უზრუნველყოფა და ქსელები. ყველა სისტემის მოცულობა, მათ შორის მონაცემების ხელმისაწვდომობის ისტორია, ტრენინგი კონფიგურაცია და ჰიპერპარამეტრი ტენდენციალურობა ყველა ტრენინგი პროცესებში, აუცილებელია. განსაკუთრებით არასდროსობის ფანჯარატებში, რეპუტაცია და პასუხისმგებლობა პროცესები მოითხოვს შესრულების ინტენსივობის. მას შემდეგ, რაც . ერთ-ერთი მოვლენები FL არის, რომ კვლევითი არ შეუძლიათ კვლევა მონაცემები, რომელშიც მოდელები გაქვთ სასწავლო, რათა განიხილოთ არასამთავრობო შედეგები. გარდა ამისა, იღებს სტატისტიკური შეზღუდვა მათი სასწავლო მონაცემები, როგორც ნაწილი მოდელი განვითარება სამუშაო ფართობი უნდა იყოს აღიარებული თანამშრომლობის პარტნიორები, როგორც არ შეუზღუდავი კონფიდენციალურობის. მიუხედავად იმისა, რომ თითოეული საიტი იქნება ხელმისაწვდომია საკუთარი ნედლეული მონაცემები, ფანჯარები შეიძლება აირჩიოს გარკვეული გარკვეული უსაფრთხო intra-node მიმოხილვა მოწყობილობა ამ საჭიროებას ან შეიძლება უზრუნველყოს სხვა გზა გაზრდის აღიარებება და 64 სისტემის არქიტექტურა განსხვავებით ფართო ფართო ფართო ფართო ფართო ფართო ფართო ფართო ფართო ფართო ფართო ფართო ფართო ფართო ფართო ფართო ფართო ფართო ფართო ფართო ფართო ფართო ფართო ფართო ფართო ფართო ფართო ფართო ფართო ფართო ფართო ფართო ფართო ფართო ფართო ფართო ფართო ფართო ფართო. სამედიცინო ინსტიტუტის მონაწილეები აღჭურვილია შედარებით ძლიერი კომპიუტერული რესურსები და საიმედო, მაღალი გადაცემის ქსელები, რომელიც საშუალებას გაძლევთ დიდი მოდულების ტრენინგი, ბევრი უფრო ადგილობრივი ტრენინგი ნაბიჯები, და უფრო მეტი მოდულების ინფორმაციის გაზიანება ნომრები შორის ნომრები. ეს უნიკალური თვისებები FL სამედიცინო სამედიცინო ასევე მოიცავს პრობლემები, როგორიცაა მონაცემთა ინტენსივობის უზრუნველყოფა კომუნიკაციის გამოყენებით redundant ნომრები, შექმნა უსაფრთხო encryption მეთოდები, რათა თავიდან ავიცილოთ მონაცემთა გაზიანება, ან განკუთვნილია შესაბამისი ნომერი სტაბილატორები, რათა უზრუნველ 9 ეს შეიძლება იყოს სხვადასხვა გზა. სიტუაციებში, რომელიც მოითხოვს ყველაზე მკაცრი მონაცემთა კონფიდენციალურობა პარტნიორების შორის, ტრენინგი შეიძლება მუშაობა გარკვეული სახის "სესუარ ბროკერი" სისტემის მეშვეობით, სადაც საიმედო სამი პარტნიორები ფუნქციონირებს როგორც მეშვეობით და საშუალებას იძლევა მონაცემების ხელმისაწვდომას. ეს კონფიდენციალურობის მოითხოვს დამოუკიდებელი ინტენსი, რომელიც კონტროლებს საერთო სისტემას, რაც შეიძლება ყოველთვის არ იყოს სასურველი, რადგან ეს შეიძლება მოიცავს დამატებითი ღირებულება და პროცესი ვიზუსტურობა. თუმცა, ის აქვს უპირატესობა, რომ ზუსტი ინტენსიური მექანიზმი შეუძლია კლიენტებისგან დაშ კონტაქტი ML, და განსაკუთრებით DL, გააჩნია მრავალფეროვანი ინოვაციები ციფრული ჯანმრთელობის სფეროში. როგორც ყველა ML მეთოდები უპირატესობად სარგებლობენ მონაცემების ხელმისაწვდომობის შესაძლებლობას, რომელიც იღებს რეალური გლობალური გაფართოებას, FL არის სასურველი მიმოხილვა, რათა მიიღოთ ძლიერი, სწორი, უსაფრთხო, ძლიერი და უარყოფითი მოდელები. საშუალებას გაძლევთ მრავალფეროვანი პარტნიორებს თანამშრომლად ტრენინგი გადახდის ან ცენტრირებული მონაცემების კომპლექტი გარეშე, FL მახასიათებლები დაკავშირებული საკითხები, რომელიც დაკავშირებულია სქესობრივი სამედიცინო მონაცემების გაფართოება. შედეგად, ეს შეიძლება გახდეს ახალი კვლევის და ბიზნეს გზა და აქვს პო მიუხედავად ამისა, ჩვენ ნამდვილად ვფიქრობ, რომ მისი პოტენციური ეფექტი სიზუსტით სამედიცინო და საბოლოო გაუმჯობესება სამედიცინო მომსახურება არის ძალიან მოწინავე. 12 შეტყობინება დამატებითი ინფორმაცია კვლევის დიზაინი ხელმისაწვდომია დაკავშირებული ამ სტატიაში. Nature Research შეტყობინებები რეიტინგები LeCun, Y., Bengio, Y. & Hinton, G. Deep learning. , 436 (2015). Nature 521 Wang, F., Casalino, L. P. & Khullar, D. Deep learning in medicine—promise, progress, and challenges. , 293–294 (2019). JAMA Intern. Med. 179 Chartrand, G. et al. Deep learning: a primer for radiologists. , 2113–2131 (2017). Radiographics 37 De Fauw, J. et al. Clinically applicable deep learning for diagnosis and referral in retinal disease. , 1342 (2018). Nat. Med. 24 Sun, C., Shrivastava, A., Singh, S. & Gupta, A. Revisiting unreasonable effectiveness of data in deep learning era. In , 843–852 ( , 2017). Proceedings of the IEEE international conference on computer vision IEEE Van Panhuis, W. G. et al. A systematic review of barriers to data sharing in public health. , 1144 (2014). BMC Public Health 14 Rocher, L., Hendrickx, J. M. & De Montjoye, Y.-A. Estimating the success of re-identifications in incomplete datasets using generative models. , 1–9 (2019). Nat. Commun. 10 Schwarz, C. G. et al. Identification of anonymous mri research participants with face-recognition software. , 1684–1686 (2019). N. Engl. J. Med. 381 McMahan, B., Moore, E., Ramage, D., Hampson, S. & y Arcas, B. A. Communication-efficient learning of deep networks from decentralized data. In , 1273–1282. (2017). Artificial Intelligence and Statistics https://scholar.google.de/scholar?hl=de&as_sdt=0%2C5&q=Communicationefficient+learning+of+deep+networks+from+decentralized+data&btnG= Li, T., Sahu, A. K., Talwalkar, A. & Smith, V. Federated learning: Challenges, methods, and future directions. , 50–60 (IEEE, 2020). IEEE Signal Processing Magazine 37 Yang, Q., Liu, Y., Chen, T. & Tong, Y. Federated machine learning: concept and applications. , 12 (2019). ACM Trans. Intell. Syst. Technol. (TIST) 10 Kairouz, P. et al. Advances and open problems in federated learning. (2019). arXiv preprint arXiv:1912.04977 Lee, J. et al. Privacy-preserving patient similarity learning in a federated environment: development and analysis. , e20 (2018). JMIR Med. Inform. 6 Brisimi, T. S. et al. Federated learning of predictive models from federated electronic health records. , 59–67 (2018). Int. J. Med. Inform. 112 Roy, A. G., Siddiqui, S., Pölsterl, S., Navab, N. & Wachinger, C. Braintorrent: a peer-to-peer environment for decentralized federated learning. (2019). arXiv preprint arXiv:1905.06731 Li, W. et al. Privacy-preserving federated brain tumour segmentation. In , 133–141 (Springer, 2019). International Workshop on Machine Learning in Medical Imaging Sheller, M. J., Reina, G. A., Edwards, B., Martin, J. & Bakas, S. Multi-institutional deep learning modeling without sharing patient data: a feasibility study on brain tumor segmentation. In , 92–104 (Springer, 2018). International MICCAI Brainlesion Workshop Li, X. et al. Multi-site fmri analysis using privacy-preserving federated learning and domain adaptation: abide results. (2020). arXiv preprint arXiv:2001.05647 Huang, L. et al. Patient clustering improves efficiency of federated machine learning to predict mortality and hospital stay time using distributed electronic medical records. , 103291 (2019). J. Biomed. Inform. 99 Xu, J. & Wang, F. Federated learning for healthcare informatics. (2019). arXiv preprint arXiv:1911.06270 Roy, A. & Banerjee, A. Ibm’s merge healthcare acquisitio . (2015) (Accessed 10 February 2020). n https://www.reuters.com/article/us-merge-healthcare-m-a-ibm/ibm-to-buy-merge-healthcare-in-1-billion-deal-idUSKCN0QB1ML20150806 Nhs scotland’s national safe haven. (2015) (Accessed 10 February 2020). https://www.gov.scot/publications/charter-safe-havens-scotland-handling-unconsented-data-national-health-service-patient-records-support-research-statistics/pages/4/ Cuggia, M. & Combes, S. The french health data hub and the german medical informatics initiatives: Two national projects to promote data sharing in healthcare. , 195–202 (2019). Yearbook Med. Informat. 28 Health Data Research UK. (Health Data Research UK, 2020) (Accessed 10 Feb 2020). https://www.hdruk.ac.uk/ Sporns, O., Tononi, G. & Kötter, R. The human connectome: a structural description of the human brain. . , e42, (2005). PLoS Comput. Biol 1 https://doi.org/10.1371/journal.pcbi.0010042 Sudlow, C. et al. Uk biobank: an open access resource for identifying the causes of a wide range of complex diseases of middle and old age. . , e1001779. (2015). PLoS Med 12 https://doi.org/10.1371/journal.pmed.1001779 Clark, K. et al. The cancer imaging archive (tcia): maintaining and operating a public information repository. , 1045–1057 (2013). J. Digit. Imaging. 26 Wang, X. et al. Chestx-ray8: Hospital-scale chest X-ray database and benchmarks on weakly-supervised classification and localization of common thorax diseases. In , 2097–2106 ( , 2017). Proceedings of the IEEE conference on computer vision and pattern recognition IEEE Yan, K., Wang, X., Lu, L. & Summers, R. M. Deeplesion: automated mining of large-scale lesion annotations and universal lesion detection with deep learning. , 036501 (2018). J Med. Imaging. 5 Tomczak, K., Czerwińska, P. & Wiznerowicz, M. The cancer genome atlas (tcga): an immeasurable source of knowledge. , A68 (2015). Contemp. Oncol. 19 Jack Jr., C. R. et al. The alzheimer’s disease neuroimaging initiative (adni): Mri methods. , 685–691 (2008). J. Magn. Reson. Imaging 27 . (2020) (Accessed 24 July 2020). Grand Challenge-a Platform for End-to-end Development of Machine Learning Solutions in Biomedical Imaging https://grand-challenge.org/ Litjens, G. et al. 1399 h&e-stained sentinel lymph node sections of breast cancer patients: the camelyon dataset. , giy065 (2018). GigaScience 7 Menze, B. H. et al. The multimodal brain tumor image segmentation benchmark (brats). , 1993–2024 (2014). IEEE Trans. Med. Imaging 34 Bakas, S. et al. Identifying the best machine learning algorithms for brain tumor segmentation, progression assessment, and overall survival prediction in the brats challenge. (2018). arXiv preprint arXiv:1811.02629 Bakas, S. et al. Advancing the cancer genome atlas glioma MRI collections with expert segmentation labels and radiomic features. , 170117 (2017). Sci. Data 4 Simpson, A. L. et al. A large annotated medical image dataset for the development and evaluation of segmentation algorithms. (2019). arXiv preprint arXiv:1902.09063 Yeh, F.-C. et al. Quantifying differences and similarities in whole-brain white matter architecture using local connectome fingerprints. , e1005203 (2016). PLoS Comput. Biol. 12 Chang, K. et al. Distributed deep learning networks among institutions for medical imaging. , 945–954 (2018). J. Am. Med. Inform. Assoc. 25 Shokri, R., Stronati, M., Song, C. & Shmatikov, V. Membership inference attacks against machine learning models. In , 3-18 (IEEE, 2017). 2017 IEEE Symposium on Security and Privacy (SP) Sablayrolles, A., Douze, M., Ollivier, Y., Schmid, C. & Jégou, H. White-box vs black-box: Bayes optimal strategies for membership inference. In Chaudhuri, K. & Salakhutdinov, R. (eds) , 5558–5567. (PMLR, 2019). Proceedings of the 36th International Conference on Machine Learning, {ICML} 97 http://proceedings.mlr.press/v97/sablayrolles19a.html Zhang, C., Bengio, S., Hardt, M., Recht, B. & Vinyals, O. Understanding deep learning requires rethinking generalization. In , (OpenReview.net, 2017). 5th International Conference on Learning Representations, {ICLR}. https://openreview.net/forum?id=Sy8gdB9xx Carlini, N., Liu, C., Erlingsson, Ú., Kos, J. & Song, D. The secret sharer: evaluating and testing unintended memorization in neural networks. In Heninger, N. & Traynor, P. (eds) { } ({ } , 267–284. ({USENIX} Association, Santa Clara, CA, USA, 2019). 28th USENIX Security Symposium USENIX Security 19 https://www.usenix.org/conference/usenixsecurity19/presentation/carlini Abadi, M. et al. Deep learning with differential privacy. In , 308–318 (ACM, 2016). Proceedings of the 2016 ACM SIGSAC Conference on Computer and Communications Security Shokri, R. & Shmatikov, V. Privacy-preserving deep learning. In , 1310–1321 (ACM, 2015). Proceedings of the 22nd ACM SIGSAC conference on computer and communications security Langlotz, C. P. et al. A roadmap for foundational research on artificial intelligence in medical imaging: from the 2018 nih/rsna/acr/the academy workshop. , 781–791 (2019). Radiology 291 Kim, Y., Sun, J., Yu, H. & Jiang, X. Federated Tensor Factorization for Computational Phenotyping. In . 887–895. (ACM, Halifax, NS, Canada, 2017). Proceedings of the 23rd {ACM} {SIGKDD} International Conference on Knowledge Discoveryand Data Mining https://doi.org/10.1145/3097983.3098118 He, C., Annavaram, M. & Avestimehr, S. Fednas: Federated deep learning via neural architecture search. (2020). https://sites.google.com/view/cvpr20-nas/ Trustworthy federated data analytics (tfda). (2020) (Accessed 28 May 2020). https://tfda.hmsp.center/ Joint Imaging Platform (Jip). (2020) (Accessed 28 May 2020). https://jip.dktk.dkfz.de/jiphomepage/ Medical institutions collaborate to improve mammogram assessment ai. (2020) (Accessed 28 May 2020). https://blogs.nvidia.com/blog/2020/04/15/federated-learning-mammogram-assessment/ Healthchain consortium. (2020) (Accessed 28 May 2020). https://www.substra.ai/en/healthchain-project The federated tumor segmentation (fets) initiative. (2020) (Accessed 28 May 2020). https://www.fets.ai Machine learning ledger orchestration for drug discovery. (2020). Accessed 28 May 2020. https://cordis.europa.eu/project/id/831472 Konečny`, J., McMahan, H. B., Ramage, D. & Richtárik, P. Federated optimization: Distributed machine learning for on-device intelligence. (2016). arXiv preprint arXiv:1610.02527 Lalitha, A., Kilinc, O. C., Javidi, T. & Koushanfar, F. Peer-to-peer federated learning on graphs. (2019). arXiv preprint arXiv:1901.11173 Li, T., Sahu, A. K., Zaheer, M., Sanjabi, M., Talwalkar, A. & Smith, V. Federated optimization in heterogeneous networks. (2018). arXiv preprint arXiv:1812.06127 Zhao, Y. et al. Federated learning with non-iid data. (2018). arxivabs/1806.00582 Li, X., Huang, K., Yang, W., Wang, S. & Zhang, Z. On the convergence of fedavg on non-IID data. (2020). https://openreview.net/forum?id=HJxNAnVtDS Wu, B. et al. P3sgd: patient privacy preserving SGD for regularizing deep CNNs in pathological image classification. In (pp. 2099–2108) (2019). Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition Zhu, L., Liu, Z. & Han, S. Deep leakage from gradients. In Wallach, H. M. et al. (eds) , 14747–14756. (2019). Advances in Neural Information Processing Systems 32: Annual Conference on Neural Information Processing Systems http://papers.nips.cc/paper/9617-deep-leakage-from-gradients Wang, Z. et al. Beyond inferring class representatives: user-level privacy leakage from federated learning. In 2512–2520. (IEEE, Paris, France, 2019). 2019 {IEEE} Conferenceon Computer Communications, {INFOCOM} https://doi.org/10.1109/INFOCOM.2019.8737416 Hitaj, B., Ateniese, G. & Perez-Cruz, F. Deep models under the gan: information leakage from collaborative deep learning. In , CCS’17, 603–618 (Association for Computing Machinery, New York, NY, USA, 2017). Proceedings of the 2017 ACM SIGSAC Conference on Computer and Communications Security Ghorbani, A. & Zou, J. Data shapley: Equitable valuation of data for machine learning. In (pp. 2242-2251) (2019). International Conference on Machine Learning აღიარება ეს მუშაობა მხარს უჭერს UK Research and Innovation London Medical Imaging & Artificial Intelligence Center for Value-Based Healthcare, Wellcome / EPSRC Center for Medical Engineering (WT203148/Z/16/Z), Wellcome Flagship Programme (WT213038/Z/18/Z), როგორც ასევე Helmholtz Initiative and Networking Fund (Project “Trustworthy Federated Data Analytics”) და PRIME პროგრამა German Academic Exchange Service (DAAD) ერთად ფინანსები German Federal Ministry of Education and Research (BMBF). კონფიდენციალურობის და მიმოხილვა ამ გამოქვეყნებული პერსონალური პასუხისმგებლობა მხოლოდ საავტომობილო და ხელმისაწვდომი და ხელმისაწვდომი. ამ სტატიაში ხელმისაწვდომია CC by 4.0 Deed (Attribution 4.0 International) ლიცენზია. ამ სტატიაში ხელმისაწვდომია CC by 4.0 Deed (Attribution 4.0 International) ლიცენზია.