อัจฉริยะ AI ที่อนุญาตให้โรงพยาบาลฝึกอัลกอริทึมโดยไม่ต้องแบ่งปันข้อมูลผู้ป่วย

ผู้เขียน : นิกโกลา Rieke จอห์นนี่ Hancox ภาษาไทย เฟอสโต Milletarì ฮอลเกอร์ R. Roth อัลบาร์คูเนีย สปิริโดน Bakas มาริโอ N. Galtier เบนเน็ต A. Landman แคลส Maier-Hein เซบาสเตียน Ourselin มิกาเชลเลอร์ แรนดอน M. Summers แอนดรู Trask ภาษาไทย โบสถ์ ฮอร์จา Cardoso ผู้เขียน : นิกโกลา Rieke จอห์นนี่ Hancox ภาษาไทย เฟอสโต Milletarì ฮอลเกอร์ R. Roth อัลบาร์คูเนีย สปิริโดน Bakas มาริโอ N. Galtier เบนเน็ต A. Landman แคลส Maier-Hein เซบาสเตียน Ourselin มิกาเชลเลอร์ แรนดอน M. Summers แอนดรู Trask ภาษาไทย โบสถ์ ฮอร์จา Cardoso สารสกัดจาก การเรียนรู้เครื่องแบบข้อมูล (ML) เป็นวิธีการที่คาดหวังในการสร้างโมเดลสถิติที่แม่นยําและทนทานจากข้อมูลทางการแพทย์ซึ่งจะเก็บรวบรวมในปริมาณมากโดยระบบการดูแลสุขภาพที่ทันสมัย ข้อมูลทางการแพทย์ที่มีอยู่ไม่ได้ใช้ประโยชน์อย่างเต็มที่โดย ML ส่วนใหญ่เพราะมันอยู่ในซิโลข้อมูลและความกังวลเกี่ยวกับความเป็นส่วนตัว จํากัด การเข้าถึงข้อมูลเหล่านี้ อย่างไรก็ตามหากไม่มีการเข้าถึงข้อมูลเพียงพอ ML จะถูกป้องกันจากการเข้าถึงศักยภาพเต็มรูปแบบและในที่สุดจะทําให้การเปลี่ยนแปลงจากการวิจัยไปสู่การปฏิบัติทางคลินิก กระดาษนี้พิจารณาปัจจัยสําคัญที่ช่วยให้ปัญหานี้สํารวจวิธีการที่การเรียนรู้พันธมิตร (FL) อาจให้โซลูชั่นสําหรับอนาคตของสุขภาพดิจิตอลและเน้นความท้าทายและข้อพิจารณาที่ต้องแก้ไข การแนะนํา การวิจัยเกี่ยวกับอัจฉริยะเทียม (AI) และโดยเฉพาะอย่างยิ่งความก้าวหน้าในการเรียนรู้เครื่อง (ML) และการเรียนรู้ลึก (DL) โมเดิร์นรุ่น DL มีพารามิเตอร์หลายล้านซึ่งต้องเรียนรู้จากชุดข้อมูลที่มีขนาดใหญ่พอที่จะบรรลุความแม่นยําระดับคลินิกในขณะที่ปลอดภัยยุติธรรมและยุติธรรมและรวมถึงข้อมูลที่ไม่เห็นได้ดี , , , . 1 2 3 4 5 ตัวอย่างเช่นการฝึกอบรมเครื่องตรวจจับเนื้องอกที่ใช้ AI ต้องใช้ฐานข้อมูลขนาดใหญ่ซึ่งครอบคลุมสเปกตรัมเต็มรูปแบบของโรคและประเภทข้อมูลการป้อนข้อมูลที่เป็นไปได้ ข้อมูลเช่นนี้เป็นเรื่องยากที่จะได้รับเนื่องจากข้อมูลสุขภาพมีความไวสูงและการใช้งานของมันถูกควบคุมอย่างเข้มงวด แม้ว่าการยกเลิกข้อมูลอาจเอาชนะข้อ จํากัด เหล่านี้ก็เข้าใจได้ดีว่าการลบข้อมูลเมตาเช่นชื่อผู้ป่วยหรือวันที่เกิดมักจะไม่เพียงพอเพื่อรักษาความเป็นส่วนตัว ตัวอย่างเช่นมันเป็นไปได้ที่จะ reconstruct ใบหน้าของผู้ป่วยจากข้อมูล tomography คอมพิวเตอร์ (CT) หรือ MRI อีกเหตุผลหนึ่งที่ทําไมการแบ่งปันข้อมูลไม่ได้เป็นระบบในด้านการดูแลสุขภาพคือการเก็บรวบรวมการจัดเก็บและบํารุงรักษาชุดข้อมูลที่มีคุณภาพสูงต้องใช้เวลาความพยายามและค่าใช้จ่ายอย่างมาก ดังนั้นชุดข้อมูลดังกล่าวอาจมีมูลค่าทางธุรกิจอย่างมีนัยสําคัญทําให้มีแนวโน้มน้อยกว่าที่พวกเขาจะถูกแบ่งปันได้อย่างอิสระ แทนที่นักเก็บข้อมูลมักจะรักษาการควบคุมอย่างละเอียดเกี่ยวกับข้อมูลที่พวกเขาได้รวบรวม 6 7 8 การเรียนรู้แบบสหพันธรัฐ (FL) , , เป็นพารามิเตอร์การเรียนรู้ที่มุ่งมั่นที่จะแก้ไขปัญหาการจัดการข้อมูลและความเป็นส่วนตัวโดยการฝึกอบรมอัลกอริทึมอย่างร่วมมือโดยไม่ต้องแลกเปลี่ยนข้อมูลด้วยตัวเอง ออกแบบมาเป็นต้นสําหรับโดเมนที่แตกต่างกันเช่นกรณีการใช้อุปกรณ์มือถือและอุปกรณ์ขอบ เมื่อเร็ว ๆ นี้ก็ได้รับแรงดึงดูดสําหรับแอพพลิเคชันด้านสุขภาพ , , , , , , , . FL ช่วยให้สามารถสร้างความเห็นได้ร่วมกันเช่นในรูปแบบของรูปแบบความเห็นด้วยความเห็นด้วยกันโดยไม่ต้องย้ายข้อมูลผู้ป่วยไปข้างนอกของผนังไฟร์วอลล์ของสถาบันที่พวกเขาอาศัยอยู่ แทนที่กระบวนการ ML จะเกิดขึ้นในท้องถิ่นในแต่ละสถาบันที่เข้าร่วมและเฉพาะลักษณะของรูปแบบ (เช่นพารามิเตอร์ gradients) จะถูกถ่ายโอนตามที่แสดงในภาพ การวิจัยล่าสุดได้แสดงให้เห็นว่ารูปแบบที่ฝึกอบรมโดย FL สามารถบรรลุระดับประสิทธิภาพที่เปรียบเทียบกับที่ฝึกอบรมบนชุดข้อมูลที่โฮสต์ศูนย์และดีกว่ารูปแบบที่เห็นข้อมูลของสถาบันเดียวเท่านั้น , . 9 10 11 12 13 14 15 16 17 18 19 20 1 16 17 เซิร์ฟเวอร์การรวบรวม FL - กระบวนการทํางาน FL แบบดั้งเดิมซึ่งความสัมพันธ์ของ nodes การฝึกอบรมจะได้รับแบบจําลองทั่วโลกส่งแบบจําลองที่ได้รับการฝึกอบรมเป็นส่วนหนึ่งของพวกเขาไปยังเซิร์ฟเวอร์กลางในระหว่างการรวบรวมและต่อการฝึกอบรมในแบบจําลองความสามัคคีที่เซิร์ฟเวอร์กลับมา FL peer to peer—สูตรทางเลือกของ FL ในขณะที่แต่ละ nodes การฝึกอบรมแลกเปลี่ยนรูปแบบที่ได้รับการฝึกอบรมบางส่วนกับบางส่วนหรือทั้งหมดของเพื่อนร่วมงานและแต่ละคนทําการรวมตัวของตัวเอง การฝึกอบรมแบบศูนย์กลาง—กระบวนการฝึกอบรมทั่วไปที่ไม่ใช่ FL ในขณะที่เว็บไซต์ที่ได้รับข้อมูลให้ข้อมูลของพวกเขาไปยังทะเลสาบข้อมูลศูนย์กลางซึ่งพวกเขาและผู้อื่นสามารถสกัดข้อมูลเพื่อการฝึกอบรมในท้องถิ่นและอิสระ a b c การดําเนินการอย่างประสบความสําเร็จของ FL อาจมีศักยภาพอย่างมีนัยสําคัญในการเปิดใช้งานการแพทย์ความแม่นยําในขนาดใหญ่ซึ่งจะนําไปสู่รูปแบบที่นําไปสู่การตัดสินใจที่ไม่เป็นมิตรและสะท้อนให้เห็นถึงสรีรวิทยาของบุคคลและมีความไวต่อโรคที่หายากในขณะที่เคารพความกังวลเกี่ยวกับการจัดการและความเป็นส่วนตัว อย่างไรก็ตาม FL ยังคงต้องมีการพิจารณาทางเทคนิคอย่างเข้มงวดเพื่อให้แน่ใจว่าอัลกอริทึมจะดําเนินการอย่างดีที่สุดโดยไม่เสี่ยงต่อความปลอดภัยหรือความเป็นส่วนตัวของผู้ป่วย อย่างไรก็ตามก็มีศักยภาพในการเอาชนะข้อ จํากัด ของวิธีการที่ต้องใช้ฐานข้อมูลแบบศูนย์กลางเดียว เรามองเห็นอนาคตแบบสหราชอาณาจักรสําหรับสุขภาพดิจิตอลและด้วยเอกสารแนวโน้มนี้เราแบ่งปันมุมมองความเห็นร่วมกันของเราด้วยวัตถุประสงค์ในการให้ความสัมพันธ์และรายละเอียดให้กับชุมชนเกี่ยวกับประโยชน์และผลกระทบของ FL สําหรับการใช้งานทางการแพทย์ (ส่วน “การแพทย์ที่มุ่งเน้นข้อมูลต้องใช้ความพยายามแบบสหราชอาณาจักร”) เช่นเดียวกับการเน้นข้อพิจารณาและท้าทายสําคัญของการใช้ FL สําหรับสุขภาพดิจิตอล (ส่วน “ข้อพิจารณาทางเทคนิค”) การแพทย์ที่ขับเคลื่อนด้วยข้อมูลต้องใช้ความพยายามของสหภาพ อย่างไรก็ตามชุดข้อมูลทางการแพทย์เป็นเรื่องยากที่จะได้รับ (ส่วนล่าง “การพึ่งพาข้อมูล”) FL แก้ไขปัญหานี้โดยการช่วยให้การเรียนรู้ร่วมกันโดยไม่ต้องศูนย์กลางข้อมูล (ส่วนล่าง “สัญญาความพยายามของสหภาพ”) และได้พบวิธีการไปยังแอปพลิเคชันด้านสุขภาพดิจิตอล (ส่วนล่าง “ความพยายามของ FL ในปัจจุบันสําหรับสุขภาพดิจิตอล”) พารามิเตอร์การเรียนรู้ใหม่นี้ต้องมีการพิจารณาจาก แต่ยังให้ประโยชน์แก่ผู้มีส่วนร่วมในด้านสุขภาพต่างๆ (ส่วนล่าง “ผลกระทบต่อผู้มีส่วนร่วม”) การพึ่งพาข้อมูล วิธีการที่ใช้ข้อมูลขึ้นอยู่กับข้อมูลที่แสดงให้เห็นถึงการกระจายข้อมูลพื้นฐานของปัญหา ในขณะที่นี่เป็นความต้องการที่รู้จักกันดีอัลกอริทึมทันสมัยมักจะได้รับการประเมินโดยใช้ชุดข้อมูลที่ได้รับการประมวลผลอย่างระมัดระวังซึ่งมักจะมาจากแหล่งเพียงไม่กี่แหล่ง สิ่งนี้สามารถนําไปสู่แนวโน้มที่ประชากร (เช่นเพศอายุ) หรือความไม่สมดุลทางเทคนิค (เช่นโปรโตคอลการซื้อขายผู้ผลิตอุปกรณ์) แปลงการคาดการณ์และส่งผลกระทบต่อความแม่นยําสําหรับกลุ่มหรือไซต์บางอย่าง อย่างไรก็ตามเพื่อจับความสัมพันธ์ที่ละเอียดอ่อนระหว่างรูปแบบโรคปัจจัยทางสังคมเศรษฐกิจและพันธุกรรมเช่นเดียวกับกรณีที่ซับซ้อนและหายากจึงเป็นสิ่งสําคัญที่จะเปิดเผยรูปแบบในกรณีต่าง ๆ ความต้องการสําหรับฐานข้อมูลขนาดใหญ่สําหรับการฝึกอบรม AI ได้ก่อให้เกิดความคิดริเริ่มจํานวนมากที่มุ่งมั่นที่จะรวมข้อมูลจากสถาบันหลายแห่ง ข้อมูลนี้มักจะรวบรวมลงในที่เรียกว่า Data Lakes เหล่านี้ได้รับการสร้างขึ้นด้วยวัตถุประสงค์ในการใช้ประโยชน์จากมูลค่าเชิงพาณิชย์ของข้อมูลเช่นการซื้อขาย Merge Healthcare ของ IBM หรือเป็นทรัพยากรสําหรับการเจริญเติบโตทางเศรษฐกิจและความก้าวหน้าทางวิทยาศาสตร์เช่น NHS สกอตแลนด์ National Safe Haven ภาษาฝรั่งเศส Health Data Hub , และ Health Data Research สหราชอาณาจักร . 21 22 23 24 วัตถุประสงค์ที่สําคัญแม้ว่าจะมีขนาดเล็กกว่ารวมถึง Human Connectome ธนาคารชีวภาพสหราชอาณาจักร การถ่ายภาพมะเร็ง (Cancer Imaging Archive, TCIA) , NIH CXR8 NIH DeepLesion Atlas Genome ของมะเร็ง (TCGA) แนะนําการถ่ายภาพประสาทโรคอัลไซเมอร์ (ADNI) เช่นเดียวกับความท้าทายทางการแพทย์ที่ยิ่งใหญ่ เช่นการท้าทาย CAMELYON การท้าทาย BRATS (International Multimodal Brain Tumor Segmentation) , , หรือ Medical Segmentation Decathlon ข้อมูลทางการแพทย์สาธารณะมักจะเป็นงานหรือโรคเฉพาะและมักจะเผยแพร่ด้วยเกรดที่แตกต่างกันของข้อ จํากัด การใช้งานบางครั้ง จํากัด 25 26 27 28 29 30 31 32 33 34 35 36 37 อย่างไรก็ตามการมุ่งเน้นหรือเผยแพร่ข้อมูลไม่เพียง แต่ก่อให้เกิดความท้าทายทางกฎหมายและจริยธรรมที่เกี่ยวข้องกับความเป็นส่วนตัวและการปกป้องข้อมูลเท่านั้น แต่ยังก่อให้เกิดความท้าทายทางเทคนิค การระบุตัวตนการควบคุมการเข้าถึงและการถ่ายโอนข้อมูลการดูแลสุขภาพได้อย่างปลอดภัยเป็นงานที่ไม่สม่ําเสมอและบางครั้งก็เป็นไปไม่ได้ ข้อมูลที่ระบุตัวตนจากบันทึกสุขภาพอิเล็กทรอนิกส์อาจดูไม่เป็นอันตรายและสอดคล้องกับ GDPR / PHI แต่เพียงไม่กี่องค์ประกอบของข้อมูลอาจช่วยให้ผู้ป่วยสามารถระบุตัวตนใหม่ได้ เช่นเดียวกับข้อมูลทางพันธุกรรมและภาพทางการแพทย์ที่ทําให้เป็นเอกลักษณ์เช่นลายนิ้วมือ ดังนั้นจึงไม่สามารถยกเลิกการระบุข้อมูลผู้ป่วยหรือการรั่วซึมข้อมูลได้หากกระบวนการยกเลิกข้อมูลจะทําลายความซื่อสัตย์ของข้อมูลซึ่งอาจทําให้มันไร้ประโยชน์ การเข้าถึงผ่านทางประตูสําหรับผู้ใช้ที่ได้รับการอนุมัติมักจะถูกนําเสนอเป็นวิธีแก้ปัญหาที่คาดการณ์ได้ อย่างไรก็ตามนอกเหนือจากการ จํากัด ความพร้อมใช้งานของข้อมูลนี้ก็เป็นไปได้เฉพาะในกรณีที่ความยินยอมที่ได้รับจากเจ้าของข้อมูลนั้นไม่มีเงื่อนไขเนื่องจากการเรียกคืนข้อมูลจากผู้ที่อาจได้เข้าถึงข้อมูลนั้นเป็นไปไม่ได้ 7 38 ความสัญญาของความพยายามของสหพันธรัฐ ข้อตกลงของ FL คือการจัดการกับความท้าทายเกี่ยวกับความเป็นส่วนตัวและการจัดการข้อมูลโดยการเปิดใช้งาน ML จากข้อมูลที่ไม่ได้ตั้งอยู่ร่วมกัน ในสภาพแวดล้อมของ FL แต่ละตัวควบคุมข้อมูลไม่เพียง แต่กําหนดกระบวนการการจัดการและนโยบายความเป็นส่วนตัวของตัวเอง แต่ยังควบคุมการเข้าถึงข้อมูลและมีความสามารถในการยกเลิกได้ ซึ่งรวมถึงการฝึกอบรมเช่นเดียวกับขั้นตอนการยืนยัน ด้วยวิธีนี้ FL สามารถสร้างโอกาสใหม่เช่นโดยการอนุญาตให้มีการยืนยันในระดับขนาดใหญ่ภายในสถาบันหรือโดยการเปิดใช้งานการวิจัยใหม่เกี่ยวกับโรคที่หายากซึ่งอัตราการฉุกเฉินต่ําและชุดข้อมูลในแต่ละสถาบันมีขนาดเล็กเกินไป การย้ายแบบจําลองไปยังข้อมูลและไม่ vice versa มีข้อได้เปรียบที่สําคัญอีกอย่างหนึ่ง: ข้อมูลทางการแพทย์ขนาดใหญ่ที่มีความเข้มข้นในการจัดเก็บข้อมูลไม่จําเป็นต้องซ้ําจากสถาบันท้องถิ่นใน ตามที่แสดงใน Fig. ทํางาน FL สามารถทําได้ด้วย topologies และแผนการคํานวณที่แตกต่างกัน สองแผนที่พบมากที่สุดสําหรับแอพพลิเคชันการดูแลสุขภาพคือผ่านเซิร์ฟเวอร์รวม , , และ peer ไปยัง peer approaches , . ในกรณีทั้งหมด FL จะให้ความลับในระดับบางอย่างเนื่องจากผู้เข้าร่วม FL ไม่เคยเข้าถึงข้อมูลโดยตรงจากสถาบันอื่น ๆ และได้รับพารามิเตอร์แบบจําลองเท่านั้นที่รวมกันผ่านผู้เข้าร่วมหลายคน ในกระบวนการทํางานของ FL กับเซิร์ฟเวอร์รวมสถาบันที่เข้าร่วมอาจยังคงไม่รู้จักกันได้ อย่างไรก็ตามได้แสดงให้เห็นว่าโมเดลตัวเองสามารถจําข้อมูลได้ภายใต้เงื่อนไขบางอย่าง , , , ดังนั้นกลไกเช่นความเป็นส่วนตัวที่แตกต่างกัน , หรือการเรียนรู้จากข้อมูลที่เข้ารหัสได้รับการนําเสนอเพื่อเพิ่มความเป็นส่วนตัวในสภาพแวดล้อม FL (cf. ส่วน “ข้อพิจารณาทางเทคนิค”) โดยรวมศักยภาพของ FL สําหรับแอพพลิเคชันด้านสุขภาพได้กระตุ้นความสนใจในชุมชน และเทคนิค FL เป็นพื้นที่วิจัยที่เติบโตขึ้น , . 2 16 17 18 15 39 40 41 42 43 44 45 46 12 20 FL topologies—สถาปัตยกรรมการสื่อสารของสหพันธรัฐ Centralized: เซิร์ฟเวอร์การรวบรวมประสานงานการฝึกอบรมและเก็บรวบรวมรวมและกระจายโมเดลไปยังและจากโหนดการฝึกอบรม (Hub & Spoke) decentralized: แต่ละปุ่มการฝึกอบรมจะเชื่อมต่อกับหนึ่งหรือมากกว่าเพื่อนร่วมงานและรวมกันเกิดขึ้นในแต่ละปุ่มใน paralel ไฮเรอริกซ์: เครือข่ายพันธมิตรสามารถประกอบด้วยหลาย sub-federations ซึ่งสามารถสร้างได้จากการผสมผสานของ Peer to Peer และ Aggregation Server federations ( )) แผนการคํานวณ FL—เส้นทางของรูปแบบผ่านหลายพันธมิตร การฝึกอบรมขั้นตอน / การเรียนรู้การถ่ายโอนวงจร เซิร์ฟเวอร์รวม Peer เป็น peer a b c d e f g ความพยายามในปัจจุบันของ FL สําหรับสุขภาพดิจิตอล เนื่องจาก FL เป็นพารามิเตอร์การเรียนรู้ทั่วไปที่ลบความต้องการในการรวมข้อมูลสําหรับการพัฒนาโมเดล AI ช่วงการใช้งานของ FL ได้ครอบคลุมทั้งหมดของ AI สําหรับการดูแลสุขภาพ โดยการให้โอกาสในการจับภาพความแตกต่างของข้อมูลที่ใหญ่ขึ้นและวิเคราะห์ผู้ป่วยในกลุ่มประชากรที่แตกต่างกัน FL อาจช่วยให้การเปลี่ยนแปลงนวัตกรรมสําหรับอนาคต แต่ยังใช้ในขณะนี้ ในบริบทของบันทึกสุขภาพอิเล็กทรอนิกส์ (EHR) ตัวอย่างเช่น FL ช่วยให้เป็นตัวแทนและค้นหาผู้ป่วยที่คล้ายคลึงกันทางคลินิก , เช่นเดียวกับการคาดการณ์การเข้าโรงพยาบาลเนื่องจากเหตุการณ์หัวใจ , อายุการตายและเวลาที่อยู่ ICU การประยุกต์ใช้และข้อดีของ FL ยังได้รับการพิสูจน์ในด้านการถ่ายภาพทางการแพทย์สําหรับการแบ่งสมองทั้งใน MRI , เช่นเดียวกับการแบ่งมะเร็งสมอง , เมื่อเร็ว ๆ นี้เทคนิคนี้ได้ถูกนํามาใช้สําหรับการจัดอันดับ fMRI เพื่อหาตัวบ่งชี้ชีวภาพที่เชื่อถือได้ที่เกี่ยวข้องกับโรค และนําเสนอเป็นวิธีการที่คาดหวังในแง่ของ COVID-19 . 13 47 14 19 15 16 17 18 48 เป็นที่น่าสังเกตว่าความพยายามของ FL ต้องการข้อตกลงเพื่อกําหนดขอบเขตวัตถุประสงค์และเทคโนโลยีที่ใช้ซึ่งเนื่องจากยังเป็นเรื่องใหม่อาจเป็นเรื่องยากที่จะสรุป ในแง่นี้นวัตกรรมขนาดใหญ่ของวันนี้จริงๆเป็นผู้นําของมาตรฐานในอนาคตสําหรับการทํางานร่วมกันที่ปลอดภัยยุติธรรมและนวัตกรรมในแอพพลิเคชันด้านสุขภาพ เหล่านี้รวมถึงคอนเสิร์ตที่มีวัตถุประสงค์เพื่อพัฒนา การวิจัยเช่นโครงการ Trustworthy Federated Data Analytics (TFDA) และแพลตฟอร์มการถ่ายภาพร่วมของเยอรมัน Cancer Consortium ซึ่งช่วยให้การวิจัยแบบแยกส่วนผ่านสถาบันวิจัยภาพทางการแพทย์ของเยอรมัน ตัวอย่างอื่นคือความร่วมมือการวิจัยระหว่างประเทศที่ใช้ FL สําหรับการพัฒนารุ่น AI สําหรับการประเมิน mammograms . การศึกษาแสดงให้เห็นว่าโมเดลที่สร้างขึ้นโดย FL มีประสิทธิภาพมากกว่าผู้ที่ได้รับการฝึกอบรมเกี่ยวกับข้อมูลของสถาบันเดียวและสามารถนํามาใช้กันอย่างแพร่หลายมากขึ้นดังนั้นพวกเขายังคงทํางานได้ดีกับข้อมูลของสถาบันอื่น ๆ อย่างไรก็ตาม FL ไม่ จํากัด เฉพาะสภาพแวดล้อมทางวิชาการเท่านั้น วิทยาลัย 49 50 51 โดยการเชื่อมโยงสถาบันการดูแลสุขภาพซึ่งไม่ จํากัด เฉพาะศูนย์วิจัย FL สามารถมี impact. The ongoing HealthChain project ตัวอย่างเช่นมีวัตถุประสงค์ในการพัฒนาและใช้กรอบ FL ในสี่โรงพยาบาลในประเทศฝรั่งเศส โซลูชันนี้สร้างรูปแบบทั่วไปที่สามารถคาดการณ์การตอบสนองการรักษาสําหรับผู้ป่วยมะเร็งเต้านมและโรคมะเร็งเมลาโนมา ช่วยให้ผู้ป่วย oncologists ระบุการรักษาที่มีประสิทธิภาพมากที่สุดสําหรับแต่ละผู้ป่วยจากสไลด์ histology หรือภาพ dermoscopy ของพวกเขา ความพยายามขนาดใหญ่อีกอย่างคือนวัตกรรม Federated Tumour Segmentation (FeTS) , ซึ่งเป็นสหพันธมิตรระหว่างประเทศของ 30 สถาบันการดูแลสุขภาพที่มุ่งมั่นใช้กรอบ FL แบบเปิดซอร์สพร้อมอินเตอร์เฟซผู้ใช้แบบกราฟิก วัตถุประสงค์คือการปรับปรุงการตรวจจับขอบเขตของมะเร็งรวมถึงมะเร็งในสมองมะเร็งเต้านมมะเร็งในตับและบาดเจ็บกระดูกจากผู้ป่วยมะเร็ง myeloma หลาย แคลนิก 52 53 พื้นที่อื่น ๆ ของผลกระทบอยู่ภายใน การวิจัยและการแปล FL ช่วยให้การวิจัยร่วมกันสําหรับแม้แต่ บริษัท ที่แข่งขัน ในแง่มุมนี้หนึ่งในนวัตกรรมที่ใหญ่ที่สุดคือโครงการ Melloddy มันเป็นโครงการที่มุ่งมั่นที่จะใช้ FL มัลติฟังก์ชั่ทั่วชุดข้อมูลของ บริษัท ยา 10 โดยการฝึกอบรมรูปแบบการคาดการณ์ทั่วไปซึ่งสะท้อนให้เห็นว่าสารเคมีผูกพันกับโปรตีนอย่างไร พันธมิตรมีวัตถุประสงค์เพื่อเพิ่มประสิทธิภาพกระบวนการค้นพบยาโดยไม่ต้องเปิดเผยข้อมูลภายในที่มีค่าสูง อุตสาหกรรม 54 ผลกระทบต่อผู้มีส่วนร่วม FL ประกอบด้วยการเปลี่ยน paradigm จากทะเลสาบข้อมูลแบบศูนย์กลางและเป็นสิ่งสําคัญที่จะเข้าใจผลกระทบของมันต่อผู้มีส่วนร่วมต่าง ๆ ในระบบนิเวศของ FL แพทย์ ผู้เชี่ยวชาญทางคลินิกมักจะสัมผัสกับกลุ่มประชากรตามตําแหน่งและสภาพแวดล้อมทางประชากรซึ่งอาจทําให้เกิดการคาดการณ์เบื่อเกี่ยวกับความน่าจะเป็นของโรคบางอย่างหรือการเชื่อมต่อของพวกเขา โดยใช้ระบบ ML ตามตัวอย่างเช่นในฐานะผู้อ่านที่สองพวกเขาสามารถเพิ่มความเชี่ยวชาญของตัวเองด้วยความรู้จากผู้เชี่ยวชาญจากสถาบันอื่น ๆ เพื่อให้มั่นใจได้ว่าการวินิจฉัยไม่สามารถบรรลุได้ในปัจจุบัน ในขณะที่สิ่งนี้ใช้กับระบบ ML โดยทั่วไประบบที่ได้รับการฝึกอบรมในรูปแบบพันธมิตรมีศักยภาพที่จะทําให้เกิดการตัดสินใจเบื่อเบื่อและมีความไวสูงขึ้นต่อกรณีที่หายากเนื่องจากพวกเขามีแนวโน้มที่จะสัมผัสกับการกระจายข้อมูลที่สมบูรณ์มากขึ้น อย่างไรก็ตามสิ่งนี้ต้องใช้ความพยายามอย่างต่อเนื่องเช่นการปฏิบัติตามข้อตกลง ผู้ป่วย ผู้ป่วยมักจะได้รับการรักษาในท้องถิ่น การตั้งค่า FL ในระดับโลกสามารถให้การตัดสินใจทางคลินิกที่มีคุณภาพสูงโดยไม่คํานึงถึงสถานที่รักษา โดยเฉพาะอย่างยิ่งผู้ป่วยที่ต้องการการดูแลทางการแพทย์ในพื้นที่ห่างไกลอาจได้รับประโยชน์จากการวินิจฉัยที่มีคุณภาพสูง ML ที่สามารถใช้ได้ในโรงพยาบาลที่มีกรณีจํานวนมาก เช่นเดียวกับโรคที่หายากหรือไม่พบบ่อยทางภูมิศาสตร์ซึ่งมีแนวโน้มที่จะมีผลกระทบเล็กน้อยหากสามารถวินิจฉัยได้อย่างรวดเร็วและแม่นยํามากขึ้น FL ยังสามารถลดอุปสรรคในการกลายเป็นผู้บริจาคข้อมูลเนื่องจากผู้ป่วยสามารถมั่นใจได้ว่าข้อมูลยังคงอยู่ในสถาบันของตัวเองและสามารถถอนการเข้าถึงข้อมูลได้ โรงพยาบาลและการปฏิบัติ โรงพยาบาลและปฏิบัติการสามารถรักษาข้อมูลผู้ป่วยด้วยความสามารถในการติดตามข้อมูลอย่างสมบูรณ์เพื่อ จํากัด ความเสี่ยงของการใช้ผิดโดยบุคคลที่สาม อย่างไรก็ตามสิ่งนี้จะต้องใช้การลงทุนในโครงสร้างพื้นฐานการคอมพิวเตอร์ในสถานที่หรือการให้บริการคลาวด์ส่วนตัวและการสอดคล้องกับรูปแบบข้อมูลมาตรฐานและ synoptic เพื่อให้สามารถฝึกอบรมและประเมินรูปแบบ ML ได้อย่างราบรื่น จํานวนความสามารถในการคํานวณที่จําเป็นขึ้นอยู่กับว่าเว็บไซต์จะเข้าร่วมในการประเมินและทดสอบเท่านั้นหรือยังในความพยายามในการฝึกอบรม แม้แต่สถาบันที่ค่อนข้างขนาดเล็กก็สามารถมีส่วนร่วมและพวกเขาจะยังคงได้รับประโยชน์จากรูปแบบที่สร้างขึ้นโดยรวม นักวิจัยและนักพัฒนา AI นักวิจัยและนักพัฒนา AI จะได้รับประโยชน์จากการเข้าถึงคอลเลกชันข้อมูลในโลกจริงขนาดใหญ่ที่มีศักยภาพซึ่งอาจส่งผลกระทบต่อห้องปฏิบัติการวิจัยขนาดเล็กและองค์กรเริ่มต้น ดังนั้นทรัพยากรสามารถนําไปสู่การแก้ปัญหาทางคลินิกและปัญหาทางเทคนิคที่เกี่ยวข้องแทนที่จะพึ่งพาการจัดหาที่ จํากัด ของชุดข้อมูลที่เปิด ในเวลาเดียวกันก็จําเป็นต้องทําการวิจัยเกี่ยวกับกลยุทธ์อัลกอริทึมสําหรับการฝึกอบรมพันธมิตรเช่นวิธีการรวมโมเดลหรือการอัปเดตได้อย่างมีประสิทธิภาพวิธีการมีความทนทานต่อการเปลี่ยนแปลงการกระจาย , , การพัฒนาตาม FL ยังหมายความว่านักวิจัยหรือนักพัฒนา AI ไม่สามารถสํารวจหรือดูข้อมูลทั้งหมดที่จําลองได้รับการฝึกอบรมเช่นไม่สามารถดูกรณีล้มเหลวแต่ละกรณีเพื่อเข้าใจว่าทําไมรุ่นปัจจุบันทํางานไม่ดีกับมัน 11 12 20 ผู้ให้บริการด้านสุขภาพ ผู้ให้บริการด้านการดูแลสุขภาพในหลายประเทศได้รับผลกระทบจากการเปลี่ยนแปลง paradigm ที่เกิดขึ้นจากปริมาณขึ้นอยู่กับค่าบริการไปสู่การดูแลสุขภาพตามมูลค่าซึ่งในทางกลับกันมีความสัมพันธ์อย่างแข็งแกร่งกับการสร้างการแพทย์ความแม่นยําที่ประสบความสําเร็จ นี่ไม่ใช่เรื่องเกี่ยวกับการส่งเสริมการบําบัดที่กําหนดเองที่แพงกว่า แต่ในทางกลับกันเกี่ยวกับการบรรลุผลลัพธ์ที่ดีขึ้นเร็วขึ้นผ่านการรักษาที่มุ่งเน้นมากขึ้นเพื่อลดค่าใช้จ่าย FL มีศักยภาพในการเพิ่มความถูกต้องและความแข็งแกร่งของ AI การดูแลสุขภาพในขณะที่ลดค่าใช้จ่ายและปรับปรุงผลลัพธ์ของผู้ป่วยและจึงอาจเป็นสิ่งสําคัญสําหรับการแพทย์ความแม่นยํา ผู้ผลิต ผู้ผลิตซอฟต์แวร์และฮาร์ดแวร์ด้านการดูแลสุขภาพอาจได้รับประโยชน์จาก FL เช่นกันเนื่องจากการรวมการเรียนรู้จากอุปกรณ์และแอพพลิเคชันมากมายโดยไม่ต้องเปิดเผยข้อมูลเฉพาะผู้ป่วยสามารถอํานวยความสะดวกในการยืนยันหรือปรับปรุงอย่างต่อเนื่องของระบบ ML ของพวกเขา อย่างไรก็ตามการรับรู้ความสามารถดังกล่าวอาจต้องมีการอัพเกรดอย่างมีนัยสําคัญไปยังคอมพิวเตอร์ท้องถิ่นการจัดเก็บข้อมูลความสามารถในการเครือข่ายและซอฟต์แวร์ที่เกี่ยวข้อง การพิจารณาทางเทคนิค FL เป็นที่รู้จักกันดีที่สุดจากงานของ Konečnỳ et al. แต่ข้อกําหนดอื่น ๆ อีกมากมายได้รับการนําเสนอในวรรณกรรม , , , ระหว่างการทํางานของ FL (รูปภาพ) ) สามารถทําได้ผ่าน topologies และแผนการคํานวณที่แตกต่างกัน (ภาพ. ), แต่เป้าหมายยังคงเหมือนกันคือการรวมความรู้ที่ได้รับจากข้อมูลที่ไม่ใช่ co-located ในส่วนนี้เราจะพูดคุยรายละเอียดเพิ่มเติมเกี่ยวกับ FL คืออะไรเช่นเดียวกับการเน้นความท้าทายที่สําคัญและข้อพิจารณาทางเทคนิคที่เกิดขึ้นเมื่อใช้ FL ในสุขภาพดิจิตอล 55 9 11 12 20 1 2 คําจํากัดความการเรียนรู้ของสหพันธรัฐ FL เป็นพารามิเตอร์การเรียนรู้ที่หลายบุคคลฝึกอบรมร่วมกันโดยไม่ต้องจําเป็นต้องแลกเปลี่ยนหรือศูนย์กลางชุดข้อมูล คําอธิบายทั่วไปของ FL คือดังนี้: หมายถึงฟังก์ชั่นการสูญเสียทั่วโลกที่ได้รับผ่านการรวมกันที่มีน้ําหนัก การสูญเสียท้องถิ่นที่คํานวณจากข้อมูลส่วนบุคคล ที่อาศัยอยู่ในบุคคลที่เกี่ยวข้องและไม่เคยแบ่งปันระหว่างพวกเขา: K XK ที่ไหน > 0 หมายถึงค่าบ่งชี้น้ําหนักที่เกี่ยวข้อง วีดีโอ ในทางปฏิบัติผู้เข้าร่วมแต่ละคนมักจะได้รับและปรับปรุงรูปแบบความเห็นด้วยกันทั่วโลกโดยการดําเนินการขั้นตอนการเพิ่มประสิทธิภาพหลายครั้งในท้องถิ่นและก่อนที่จะแบ่งปันการอัปเดตโดยตรงหรือผ่านเซิร์ฟเวอร์พารามิเตอร์ มากกว่าขั้นตอนการฝึกอบรมในท้องถิ่นจะดําเนินการน้อยกว่าจะรับประกันว่าขั้นตอนโดยรวมจะลดลง (Eq. ) , กระบวนการที่เกิดขึ้นจริงสําหรับการรวมพารามิเตอร์ขึ้นอยู่กับโซลูชั่นเครือข่ายเนื่องจากโซลูชั่นอาจแยกออกเป็นโซลูชั่นเนื่องจากข้อ จํากัด ทางภูมิศาสตร์หรือทางกฎหมาย (ดูภาพ. ). กลยุทธ์การรวบรวมสามารถขึ้นอยู่กับปุ่มรวบรวมเดียว (โมเดล Hub และ Speeches) หรือหลายปุ่มโดยไม่มีการมุ่งเน้น ตัวอย่างคือ peer-to-peer FL ที่มีการเชื่อมต่อระหว่างผู้เข้าร่วมทั้งหมดหรือกลุ่มย่อยและการอัปเดตโมเดลจะถูกแบ่งปันเฉพาะระหว่างเว็บไซต์ที่เชื่อมต่อโดยตรง , ในขณะที่ตัวอย่างของการรวม FL ที่ศูนย์กลางจะนําเสนอในอัลกอริทึม 1 โปรดทราบว่ากลยุทธ์รวมไม่จําเป็นต้องใช้ข้อมูลเกี่ยวกับการปรับปรุงแบบจําลองเต็มรูปแบบ ลูกค้าอาจเลือกที่จะแบ่งปันเพียงส่วนประกอบของพารามิเตอร์แบบจําลองเพื่อลดการสื่อสารด้านบนเพื่อให้แน่ใจว่าการรักษาความเป็นส่วนตัวที่ดีขึ้น หรือเพื่อผลิตอัลกอริทึมการเรียนรู้หลายงานที่มีเพียงส่วนหนึ่งของพารามิเตอร์ของพวกเขาได้เรียนรู้ในรูปแบบพันธมิตร 1 9 12 2 15 56 10 กรอบรวมที่ช่วยให้การฝึกอบรมต่างๆสามารถแยกทรัพยากรการคํานวณ (ข้อมูลและเซิร์ฟเวอร์) จากระบบ ตามที่แสดงใน Fig. ล่าสุดกําหนดเส้นทางของรุ่นในหลายพันธมิตรที่จะได้รับการฝึกอบรมและประเมินเกี่ยวกับชุดข้อมูลเฉพาะ แผนคอมพิวเตอร์ 2 ความท้าทายและข้อพิจารณา แม้จะมีข้อได้เปรียบของ FL แต่ก็ไม่ได้แก้ปัญหาทั้งหมดที่เกี่ยวข้องกับการเรียนรู้เกี่ยวกับข้อมูลทางการแพทย์ การฝึกอบรมแบบจําลองที่ประสบความสําเร็จยังคงขึ้นอยู่กับปัจจัยเช่นคุณภาพของข้อมูลความปรารถนาและมาตรฐาน . ปัญหาเหล่านี้ต้องได้รับการแก้ไขสําหรับความพยายามในการเรียนรู้ทั้งสหพันธรัฐและไม่สหพันธรัฐผ่านมาตรการที่เหมาะสมเช่นการออกแบบการศึกษาที่ระมัดระวังโปรโตคอลทั่วไปสําหรับการเก็บรวบรวมข้อมูลการรายงานแบบโครงสร้างและวิธีการที่ซับซ้อนสําหรับการค้นพบการบิดเบือนและการโครงสร้างที่ซ่อนอยู่ ในด้านล่างเราจะสัมผัสกับแง่มุมสําคัญของ FL ที่มีความเกี่ยวข้องโดยเฉพาะอย่างยิ่งเมื่อนําไปใช้กับสุขภาพดิจิตอลและจําเป็นต้องพิจารณาเมื่อสร้าง FL สําหรับรายละเอียดทางเทคนิคและการสนทนาอย่างลึกซึ้งเราแนะนําผู้อ่านไปยังการสํารวจล่าสุด , , . 2 11 12 20 ข้อมูล heterogeneity ข้อมูลทางการแพทย์มีความหลากหลายอย่างยิ่ง - ไม่เพียง แต่เนื่องจากความหลากหลายของรูปแบบความหลากหลายและลักษณะโดยทั่วไป แต่แม้แต่ภายในโปรโตคอลที่เฉพาะเจาะจงเนื่องจากปัจจัยเช่นความแตกต่างในการซื้อขายแบรนด์ของอุปกรณ์ทางการแพทย์หรือข้อมูลประชากรในท้องถิ่น FL อาจช่วยแก้ไขแหล่งที่มาของความขัดแย้งบางอย่างผ่านความหลากหลายที่เพิ่มขึ้นของแหล่งข้อมูล แต่การกระจายข้อมูลที่ไม่สม่ําเสมอก่อให้เกิดความท้าทายต่ออัลกอริทึมและกลยุทธ์ FL เนื่องจากหลายคนคิดว่าข้อมูล IID จะกระจายเป็นอิสระและเหมือนกันทั่วผู้เข้าร่วม โดยทั่วไปกลยุทธ์เช่น มีแนวโน้มที่จะล้มเหลวในเงื่อนไขเหล่านี้ , , , ส่วนหนึ่งจะเอาชนะวัตถุประสงค์ของกลยุทธ์การเรียนรู้ร่วมกัน อย่างไรก็ตามผลลัพธ์ล่าสุดแสดงให้เห็นว่าการฝึกอบรม FL ยังคงเป็นไปได้ แม้ว่าข้อมูลทางการแพทย์จะไม่ได้กระจายกันอย่างสม่ําเสมอทั่วสถาบัน , หรือรวมถึง bias พื้นที่ การวิจัยในการแก้ปัญหานี้รวมถึงเช่น กลยุทธ์การแบ่งปันข้อมูลบางส่วน และ FL ด้วยการปรับแต่งโดเมน ความท้าทายอีกประการหนึ่งคือความไม่สม่ําเสมอของข้อมูลอาจนําไปสู่สถานการณ์ที่โซลูชั่นที่ดีที่สุดทั่วโลกอาจไม่เหมาะสมสําหรับผู้เข้าร่วมในท้องถิ่นแต่ละบุคคล ดังนั้นการกําหนดค่าของรูปแบบการฝึกอบรมที่ดีที่สุดควรได้รับการยอมรับโดยผู้เข้าร่วมทั้งหมดก่อนการฝึกอบรม เฟดอัฟ 9 9 57 58 59 16 17 51 เฟดProx 57 58 18 ความเป็นส่วนตัวและความปลอดภัย ข้อมูลการดูแลสุขภาพมีความไวสูงและต้องได้รับการปกป้องตามขั้นตอนการรักษาความลับที่เหมาะสม ดังนั้นบางส่วนของการพิจารณาที่สําคัญคือการท้าทายการกลยุทธ์และความเสี่ยงที่เหลือเกี่ยวกับศักยภาพในการรักษาความเป็นส่วนตัวของ FL ความเป็นส่วนตัว vs. ประสิทธิภาพ: มันเป็นสิ่งสําคัญที่จะสังเกตว่า FL ไม่แก้ปัญหาความเป็นส่วนตัวที่อาจเกิดขึ้นทั้งหมด และ – เช่นเดียวกับอัลกอริทึม ML โดยทั่วไป – จะมักจะมีความเสี่ยงบางอย่าง เทคนิคการรักษาความเป็นส่วนตัวสําหรับ FL มีระดับการป้องกันที่เกินกว่ารุ่น ML ที่มีอยู่ในเชิงพาณิชย์ในปัจจุบัน อย่างไรก็ตามมีข้อเสียในแง่ของประสิทธิภาพและเทคนิคเหล่านี้อาจส่งผลต่อตัวอย่างเช่นความถูกต้องของรุ่นสุดท้าย นอกจากนี้เทคนิคในอนาคตและ / หรือข้อมูลเสริมอาจถูกนํามาใช้เพื่อขัดแย้งกับรูปแบบที่ถือว่ามีความเสี่ยงต่ํา 12 10 ระดับความไว้วางใจ: โดยทั่วไปผู้มีส่วนร่วมสามารถเข้าสู่สองประเภทของความร่วมมือ FL: —สําหรับสมาคม FL ในกรณีที่ทุกบุคคลถือว่าเชื่อถือได้และผูกพันโดยข้อตกลงการทํางานร่วมกันที่สามารถบังคับใช้ได้เราสามารถกําจัดแรงจูงใจอันรุนแรงมากขึ้นเช่นความพยายามอย่างมีนัยสําคัญในการสกัดข้อมูลที่สําคัญหรือเพื่อทําลายแบบจําลองอย่างมีนัยสําคัญ สิ่งนี้ช่วยลดความจําเป็นในการใช้มาตรการตอบสนองที่ซับซ้อนโดยย้อนกลับไปสู่หลักการของการวิจัยร่วมกันมาตรฐาน ความไว้วางใจ —ในระบบ FL ที่ทํางานในขนาดใหญ่อาจเป็นไปไม่ได้ที่จะสร้างข้อตกลงการทํางานร่วมกันที่สามารถบังคับใช้ได้ ลูกค้าบางรายอาจพยายามลดประสิทธิภาพการทํางานของระบบลดลงหรือสกัดข้อมูลจากบุคคลอื่น ดังนั้นจึงจําเป็นต้องใช้กลยุทธ์ด้านความปลอดภัยเพื่อลดความเสี่ยงเหล่านี้เช่นการเข้ารหัสขั้นสูงของการส่งแบบจําลองการตรวจสอบที่ปลอดภัยของทุกบุคคลการติดตามการกระทําระบบความเป็นส่วนตัวที่แตกต่างกันระบบการตรวจสอบความสมบูรณ์ของการดําเนินการความเป็นส่วนตัวของรุ่นและการป้องกันจากการโจมตีของฝ่ายตรงข้าม ไม่เชื่อถือ การรั่วไหลของข้อมูล: โดยการกําหนดระบบ FL หลีกเลี่ยงการแบ่งปันข้อมูลการดูแลสุขภาพระหว่างสถาบันที่เข้าร่วม อย่างไรก็ตามข้อมูลที่แบ่งปันอาจยังคงเปิดเผยข้อมูลส่วนบุคคลที่ใช้สําหรับการฝึกอบรมในท้องถิ่นโดยตรงเช่นโดยการเปลี่ยนรูปแบบ ของรุ่นการปรับปรุง gradients ตัวเอง หรือการโจมตีต่อต้าน , FL มีความแตกต่างจากการฝึกอบรมแบบดั้งเดิมในแง่ที่กระบวนการฝึกอบรมจะสัมผัสกับหลายบุคคลซึ่งจะเพิ่มความเสี่ยงของการรั่วไหลผ่านทางวิศวกรรมย้อนกลับหากผู้ต่อสู้สามารถสังเกตการเปลี่ยนแปลงแบบจําลองตามเวลาสังเกตการอัปเดตแบบจําลองเฉพาะ (เช่นการอัปเดตของสถาบันเดียว) หรือจัดการแบบจําลอง (เช่นการกระตุ้นการจําลองเพิ่มเติมโดยผู้อื่นผ่านการโจมตีแบบ gradient-ascent) การพัฒนาการป้องกันเช่นการ จํากัด ความละเอียดของการอัปเดตและเพิ่มเสียงรบกวน , และให้ความเป็นส่วนตัวที่แตกต่างกันเพียงพอ อาจมีความจําเป็นและยังคงเป็นสาขาวิจัยที่ใช้งานอยู่ . 60 61 62 63 16 18 44 12 ความสามารถในการติดตามและความรับผิดชอบ เช่นเดียวกับทุกแอพพลิเคชันที่สําคัญด้านความปลอดภัยความสามารถในการทําซ้ําของระบบมีความสําคัญสําหรับ FL ในด้านการดูแลสุขภาพ ในทางตรงกันข้ามกับการฝึกอบรมแบบศูนย์กลาง FL ต้องการการคํานวณหลายฝ่ายในสภาพแวดล้อมที่มีความหลากหลายอย่างมากในแง่ของฮาร์ดแวร์ซอฟต์แวร์และเครือข่าย ความสามารถในการติดตามทรัพยากรของระบบทั้งหมดรวมถึงประวัติการเข้าถึงข้อมูลการกําหนดค่าการฝึกอบรมและการปรับระดับไฮเปอร์พารามิเตอร์ตลอดกระบวนการฝึกอบรมจึงเป็นสิ่งจําเป็น โดยเฉพาะอย่างยิ่งในสหพันธมิตรที่ไม่น่าเชื่อถือความสามารถในการติดตามและกระบวนการรับผิดชอบต้องมีความสมบูรณ์ในการดําเนินการ หลังจากที่กระบวนการฝึกอบรมบรรลุเกณฑ์การเพิ่มประสิทธิภาพแบบจําลองที่ตกลงกันด้วยกันก็อาจเป็นประโยชน์ในการวัดปริมาณการมีส่วนร่วม นอกจากนี้การวัดสถิติของข้อมูลการฝึกอบรมของพวกเขาเป็นส่วนหนึ่งของกระบวนการทํางานของการพัฒนารูปแบบจะต้องได้รับการอนุมัติโดยบุคคลที่ร่วมมือเพื่อไม่ละเมิดความเป็นส่วนตัว แม้ว่าแต่ละไซต์จะสามารถเข้าถึงข้อมูลดิบของตัวเอง แต่สหพันธมิตรอาจตัดสินใจที่จะให้ความปลอดภัยในการดูภายในโซลูชั่นเพื่อตอบสนองความต้องการนี้หรืออาจให้วิธีการอื่น ๆ เพื่อเพิ่มความสามารถในการอธิบายและความเข้าใจของโมเดลทั่วโลก 64 โครงสร้างระบบ ไม่เหมือนกับการทํางานของ FL ขนาดใหญ่ในหมู่อุปกรณ์ผู้บริโภคเช่น McMahan et al. ผู้เข้าร่วมสถาบันการดูแลสุขภาพพร้อมกับทรัพยากรการคํานวณที่มีประสิทธิภาพและเครือข่ายความน่าเชื่อถือสูงช่วยให้สามารถฝึกอบรมโมเดลขนาดใหญ่ที่มีขั้นตอนการฝึกอบรมในท้องถิ่นมากขึ้นและแบ่งปันข้อมูลโมเดลมากขึ้นระหว่าง nodes คุณสมบัติที่ไม่ซ้ํากันของ FL ในด้านการดูแลสุขภาพเหล่านี้ยังนําไปสู่ความท้าทายเช่นการรับประกันความสมบูรณ์ของข้อมูลเมื่อสื่อสารโดยใช้ nodes ที่หายไปการออกแบบวิธีการเข้ารหัสที่ปลอดภัยเพื่อป้องกันการรั่วไหลของข้อมูลหรือการออกแบบตาราง nodes ที่เหมาะสมเพื่อใช้ประโยชน์ที่ดีที่สุดของอุปกรณ์การคํานวณแบบกระจายและลดเวลาว่าง 9 การบริหารงานของสหพันธมิตรดังกล่าวสามารถทําได้ในวิธีที่แตกต่างกัน ในสถานการณ์ที่ต้องการความเป็นส่วนตัวของข้อมูลที่เข้มงวดที่สุดระหว่างฝ่ายการฝึกอบรมอาจทํางานผ่านระบบ "โบรกเกอร์ที่ซื่อสัตย์" ที่บุคคลที่สามที่เชื่อถือได้ทําหน้าที่เป็นตัวกลางและช่วยให้การเข้าถึงข้อมูลได้ง่ายขึ้น การตั้งค่านี้จําเป็นต้องมีองค์กรที่เป็นอิสระที่ควบคุมระบบโดยรวมซึ่งอาจไม่ต้องการเสมอเนื่องจากอาจเกี่ยวข้องกับค่าใช้จ่ายเพิ่มเติมและความหนาแน่นในขั้นตอน อย่างไรก็ตามมันมีข้อได้เปรียบที่กลไกภายในที่แม่นยําสามารถถูกลบออกจากลูกค้าทําให้ระบบมีความยืดหยุ่นและง่ายต่อการอัปเดต ในระบบ peer-to-peer แต่ละเว็บไซต์มีปฏิสัมพันธ์โดยตรงกับบางส่วนหรือทั้งหมดของผู้เข้าร่วมอื่น ๆ กล่าวอีกนัยหนึ่งไม่มีฟังก์ชั่นการรักษาประตูโปรโตคอล ข้อสรุป ML และโดยเฉพาะอย่างยิ่ง DL ได้นําไปสู่การนวัตกรรมที่หลากหลายในด้านการดูแลสุขภาพดิจิตอล เนื่องจากวิธีการ ML ทั้งหมดได้รับประโยชน์อย่างมากจากความสามารถในการเข้าถึงข้อมูลที่ใกล้เคียงกับการกระจายข้อมูลทั่วโลกที่แท้จริง FL เป็นวิธีการที่คาดหวังในการได้รับโมเดลที่มีประสิทธิภาพความแม่นยําปลอดภัยทนทานและไม่เป็นมิติ โดยการอนุญาตให้บุคคลหลายคนฝึกอบรมร่วมกันโดยไม่จําเป็นต้องแลกเปลี่ยนหรือศูนย์กลางชุดข้อมูล FL จัดการปัญหาที่เกี่ยวข้องกับการไหลของข้อมูลทางการแพทย์ที่ละเอียดอ่อน เป็นผลให้สามารถเปิดทางวิจัยและธุรกิจใหม่ ๆ และมีศักยภาพในการปรับปรุงการดูแลผู้ป่วยทั่วโลก อย่างไรก็ตามในปัจจุบันแล้ว FL มีผลกระทบต่อผู้มีส่วนเกี่ยวข้องเกือบทั้งหมดและรอบการรักษาทั้งหมดตั้งแต่การวิเคราะห์ภาพทางการแพทย์ที่ปรับปรุงให้แพทย์ด้วยเครื่องมือการวินิจฉัยที่ดีกว่าการแพทย์ที่มีความแม่นย อย่างไรก็ตามเราเชื่อว่าผลกระทบที่เป็นไปได้ของมันต่อการแพทย์ความแม่นยําและในที่สุดเพื่อปรับปรุงการดูแลทางการแพทย์เป็นที่น่าทึ่งมาก 12 รายงานสรุป ข้อมูลเพิ่มเติมเกี่ยวกับการออกแบบการวิจัยสามารถใช้ได้ใน เชื่อมโยงกับบทความนี้ Nature Research รายงานสรุป การอ้างอิง LeCun, Y., Bengio, Y. & Hinton, G. Deep learning. , 436 (2015). Nature 521 Wang, F., Casalino, L. P. & Khullar, D. Deep learning in medicine—promise, progress, and challenges. , 293–294 (2019). JAMA Intern. Med. 179 Chartrand, G. et al. Deep learning: a primer for radiologists. , 2113–2131 (2017). Radiographics 37 De Fauw, J. et al. Clinically applicable deep learning for diagnosis and referral in retinal disease. , 1342 (2018). Nat. Med. 24 Sun, C., Shrivastava, A., Singh, S. & Gupta, A. Revisiting unreasonable effectiveness of data in deep learning era. In , 843–852 ( , 2017). Proceedings of the IEEE international conference on computer vision IEEE Van Panhuis, W. G. et al. A systematic review of barriers to data sharing in public health. , 1144 (2014). BMC Public Health 14 Rocher, L., Hendrickx, J. M. & De Montjoye, Y.-A. Estimating the success of re-identifications in incomplete datasets using generative models. , 1–9 (2019). Nat. Commun. 10 Schwarz, C. G. et al. Identification of anonymous mri research participants with face-recognition software. , 1684–1686 (2019). N. Engl. J. Med. 381 McMahan, B., Moore, E., Ramage, D., Hampson, S. & y Arcas, B. A. Communication-efficient learning of deep networks from decentralized data. In , 1273–1282. (2017). Artificial Intelligence and Statistics https://scholar.google.de/scholar?hl=de&as_sdt=0%2C5&q=Communicationefficient+learning+of+deep+networks+from+decentralized+data&btnG= Li, T., Sahu, A. K., Talwalkar, A. & Smith, V. Federated learning: Challenges, methods, and future directions. , 50–60 (IEEE, 2020). IEEE Signal Processing Magazine 37 Yang, Q., Liu, Y., Chen, T. & Tong, Y. Federated machine learning: concept and applications. , 12 (2019). ACM Trans. Intell. Syst. Technol. (TIST) 10 Kairouz, P. et al. Advances and open problems in federated learning. (2019). arXiv preprint arXiv:1912.04977 Lee, J. et al. Privacy-preserving patient similarity learning in a federated environment: development and analysis. , e20 (2018). JMIR Med. Inform. 6 Brisimi, T. S. et al. Federated learning of predictive models from federated electronic health records. , 59–67 (2018). Int. J. Med. Inform. 112 Roy, A. G., Siddiqui, S., Pölsterl, S., Navab, N. & Wachinger, C. Braintorrent: a peer-to-peer environment for decentralized federated learning. (2019). arXiv preprint arXiv:1905.06731 Li, W. et al. Privacy-preserving federated brain tumour segmentation. In , 133–141 (Springer, 2019). International Workshop on Machine Learning in Medical Imaging Sheller, M. J., Reina, G. A., Edwards, B., Martin, J. & Bakas, S. Multi-institutional deep learning modeling without sharing patient data: a feasibility study on brain tumor segmentation. In , 92–104 (Springer, 2018). International MICCAI Brainlesion Workshop Li, X. et al. Multi-site fmri analysis using privacy-preserving federated learning and domain adaptation: abide results. (2020). arXiv preprint arXiv:2001.05647 Huang, L. et al. Patient clustering improves efficiency of federated machine learning to predict mortality and hospital stay time using distributed electronic medical records. , 103291 (2019). J. Biomed. Inform. 99 Xu, J. & Wang, F. Federated learning for healthcare informatics. (2019). arXiv preprint arXiv:1911.06270 Roy, A. & Banerjee, A. Ibm’s merge healthcare acquisitio . (2015) (Accessed 10 February 2020). n https://www.reuters.com/article/us-merge-healthcare-m-a-ibm/ibm-to-buy-merge-healthcare-in-1-billion-deal-idUSKCN0QB1ML20150806 Nhs scotland’s national safe haven. (2015) (Accessed 10 February 2020). https://www.gov.scot/publications/charter-safe-havens-scotland-handling-unconsented-data-national-health-service-patient-records-support-research-statistics/pages/4/ Cuggia, M. & Combes, S. The french health data hub and the german medical informatics initiatives: Two national projects to promote data sharing in healthcare. , 195–202 (2019). Yearbook Med. Informat. 28 Health Data Research UK. (Health Data Research UK, 2020) (Accessed 10 Feb 2020). https://www.hdruk.ac.uk/ Sporns, O., Tononi, G. & Kötter, R. The human connectome: a structural description of the human brain. . , e42, (2005). PLoS Comput. Biol 1 https://doi.org/10.1371/journal.pcbi.0010042 Sudlow, C. et al. Uk biobank: an open access resource for identifying the causes of a wide range of complex diseases of middle and old age. . , e1001779. (2015). PLoS Med 12 https://doi.org/10.1371/journal.pmed.1001779 Clark, K. et al. The cancer imaging archive (tcia): maintaining and operating a public information repository. , 1045–1057 (2013). J. Digit. Imaging. 26 Wang, X. et al. Chestx-ray8: Hospital-scale chest X-ray database and benchmarks on weakly-supervised classification and localization of common thorax diseases. In , 2097–2106 ( , 2017). Proceedings of the IEEE conference on computer vision and pattern recognition IEEE Yan, K., Wang, X., Lu, L. & Summers, R. M. Deeplesion: automated mining of large-scale lesion annotations and universal lesion detection with deep learning. , 036501 (2018). J Med. Imaging. 5 Tomczak, K., Czerwińska, P. & Wiznerowicz, M. The cancer genome atlas (tcga): an immeasurable source of knowledge. , A68 (2015). Contemp. Oncol. 19 Jack Jr., C. R. et al. The alzheimer’s disease neuroimaging initiative (adni): Mri methods. , 685–691 (2008). J. Magn. Reson. Imaging 27 . (2020) (Accessed 24 July 2020). Grand Challenge-a Platform for End-to-end Development of Machine Learning Solutions in Biomedical Imaging https://grand-challenge.org/ Litjens, G. et al. 1399 h&e-stained sentinel lymph node sections of breast cancer patients: the camelyon dataset. , giy065 (2018). GigaScience 7 Menze, B. H. et al. The multimodal brain tumor image segmentation benchmark (brats). , 1993–2024 (2014). IEEE Trans. Med. Imaging 34 Bakas, S. et al. Identifying the best machine learning algorithms for brain tumor segmentation, progression assessment, and overall survival prediction in the brats challenge. (2018). arXiv preprint arXiv:1811.02629 Bakas, S. et al. Advancing the cancer genome atlas glioma MRI collections with expert segmentation labels and radiomic features. , 170117 (2017). Sci. Data 4 Simpson, A. L. et al. A large annotated medical image dataset for the development and evaluation of segmentation algorithms. (2019). arXiv preprint arXiv:1902.09063 Yeh, F.-C. et al. Quantifying differences and similarities in whole-brain white matter architecture using local connectome fingerprints. , e1005203 (2016). PLoS Comput. Biol. 12 Chang, K. et al. Distributed deep learning networks among institutions for medical imaging. , 945–954 (2018). J. Am. Med. Inform. Assoc. 25 Shokri, R., Stronati, M., Song, C. & Shmatikov, V. Membership inference attacks against machine learning models. In , 3-18 (IEEE, 2017). 2017 IEEE Symposium on Security and Privacy (SP) Sablayrolles, A., Douze, M., Ollivier, Y., Schmid, C. & Jégou, H. White-box vs black-box: Bayes optimal strategies for membership inference. In Chaudhuri, K. & Salakhutdinov, R. (eds) , 5558–5567. (PMLR, 2019). Proceedings of the 36th International Conference on Machine Learning, {ICML} 97 http://proceedings.mlr.press/v97/sablayrolles19a.html Zhang, C., Bengio, S., Hardt, M., Recht, B. & Vinyals, O. Understanding deep learning requires rethinking generalization. In , (OpenReview.net, 2017). 5th International Conference on Learning Representations, {ICLR}. https://openreview.net/forum?id=Sy8gdB9xx Carlini, N., Liu, C., Erlingsson, Ú., Kos, J. & Song, D. The secret sharer: evaluating and testing unintended memorization in neural networks. In Heninger, N. & Traynor, P. (eds) { } ({ } , 267–284. ({USENIX} Association, Santa Clara, CA, USA, 2019). 28th USENIX Security Symposium USENIX Security 19 https://www.usenix.org/conference/usenixsecurity19/presentation/carlini Abadi, M. et al. Deep learning with differential privacy. In , 308–318 (ACM, 2016). Proceedings of the 2016 ACM SIGSAC Conference on Computer and Communications Security Shokri, R. & Shmatikov, V. Privacy-preserving deep learning. In , 1310–1321 (ACM, 2015). Proceedings of the 22nd ACM SIGSAC conference on computer and communications security Langlotz, C. P. et al. A roadmap for foundational research on artificial intelligence in medical imaging: from the 2018 nih/rsna/acr/the academy workshop. , 781–791 (2019). Radiology 291 Kim, Y., Sun, J., Yu, H. & Jiang, X. Federated Tensor Factorization for Computational Phenotyping. In . 887–895. (ACM, Halifax, NS, Canada, 2017). Proceedings of the 23rd {ACM} {SIGKDD} International Conference on Knowledge Discoveryand Data Mining https://doi.org/10.1145/3097983.3098118 He, C., Annavaram, M. & Avestimehr, S. Fednas: Federated deep learning via neural architecture search. (2020). https://sites.google.com/view/cvpr20-nas/ Trustworthy federated data analytics (tfda). (2020) (Accessed 28 May 2020). https://tfda.hmsp.center/ Joint Imaging Platform (Jip). (2020) (Accessed 28 May 2020). https://jip.dktk.dkfz.de/jiphomepage/ Medical institutions collaborate to improve mammogram assessment ai. (2020) (Accessed 28 May 2020). https://blogs.nvidia.com/blog/2020/04/15/federated-learning-mammogram-assessment/ Healthchain consortium. (2020) (Accessed 28 May 2020). https://www.substra.ai/en/healthchain-project The federated tumor segmentation (fets) initiative. (2020) (Accessed 28 May 2020). https://www.fets.ai Machine learning ledger orchestration for drug discovery. (2020). Accessed 28 May 2020. https://cordis.europa.eu/project/id/831472 Konečny`, J., McMahan, H. B., Ramage, D. & Richtárik, P. Federated optimization: Distributed machine learning for on-device intelligence. (2016). arXiv preprint arXiv:1610.02527 Lalitha, A., Kilinc, O. C., Javidi, T. & Koushanfar, F. Peer-to-peer federated learning on graphs. (2019). arXiv preprint arXiv:1901.11173 Li, T., Sahu, A. K., Zaheer, M., Sanjabi, M., Talwalkar, A. & Smith, V. Federated optimization in heterogeneous networks. (2018). arXiv preprint arXiv:1812.06127 Zhao, Y. et al. Federated learning with non-iid data. (2018). arxivabs/1806.00582 Li, X., Huang, K., Yang, W., Wang, S. & Zhang, Z. On the convergence of fedavg on non-IID data. (2020). https://openreview.net/forum?id=HJxNAnVtDS Wu, B. et al. P3sgd: patient privacy preserving SGD for regularizing deep CNNs in pathological image classification. In (pp. 2099–2108) (2019). Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition Zhu, L., Liu, Z. & Han, S. Deep leakage from gradients. In Wallach, H. M. et al. (eds) , 14747–14756. (2019). Advances in Neural Information Processing Systems 32: Annual Conference on Neural Information Processing Systems http://papers.nips.cc/paper/9617-deep-leakage-from-gradients Wang, Z. et al. Beyond inferring class representatives: user-level privacy leakage from federated learning. In 2512–2520. (IEEE, Paris, France, 2019). 2019 {IEEE} Conferenceon Computer Communications, {INFOCOM} https://doi.org/10.1109/INFOCOM.2019.8737416 Hitaj, B., Ateniese, G. & Perez-Cruz, F. Deep models under the gan: information leakage from collaborative deep learning. In , CCS’17, 603–618 (Association for Computing Machinery, New York, NY, USA, 2017). Proceedings of the 2017 ACM SIGSAC Conference on Computer and Communications Security Ghorbani, A. & Zou, J. Data shapley: Equitable valuation of data for machine learning. In (pp. 2242-2251) (2019). International Conference on Machine Learning การยอมรับ งานนี้ได้รับการสนับสนุนโดย UK Research and Innovation London Medical Imaging & Artificial Intelligence Centre for Value-Based Healthcare, โดย Wellcome / EPSRC Center for Medical Engineering (WT203148/Z/16/Z), โดย Wellcome Flagship Programme (WT213038/Z/18/Z), โดย Intramural Research Programme of the National Institutes of Health (NIH) Clinical Center, โดย National Cancer Institute of the NIH under award number U01CA242871, โดย National Institute of Neurological Disorders and Stroke of the NIH under award number R01NS042645, เช่นเดียวกับโดย Helmholtz Initiative and Networking Fund (โครงการ “Trustworthy Federated Data Analytics”) และโปรแกรม PRIME ของ German Academic Exchange Service (DAAD) พร้อมเงินทุนจากรัฐบาลกลางของเยอรมนี (BMBF) เนื้อ กระดาษนี้สามารถใช้ได้ภายใต้ใบอนุญาต CC by 4.0 Deed (Attribution 4.0 International) กระดาษนี้สามารถใช้ได้ภายใต้ใบอนุญาต CC by 4.0 Deed (Attribution 4.0 International)