Οι συγγραφείς: ΝΙΚΟΛΑ ΡΙΚΕ Jonny Hancox Βενιζέλος Λι Φάουστο Μιλετάρι Χόλγκερ Ρ. Ροθ ΑΛΒΑΡΚΟΥΝΙ ΑΛΒΑΡΚΟΥΝΙ Spyridon Bakas Mathieu N. Galtier Μπένετ Α. Λάντμαν Κλάους Μάιερ-Χέιν ΣΕΒΑΣΤΙΑΝ ΟΥΡΣΕΛΙΝ Μίκα Σέλερ Ρόναλντ Μ. Σάμερς Andrew Trask Ντάγκουανγκ Σου Μαξιμιλιανός Μπάουστ Τζορτζ Καρντόζο Οι συγγραφείς: ΝΙΚΟΛΑ ΡΙΚΕ Τζόνι Χάνκοξ Βενιζέλος Λι Φάουστο Μιλετάρι Χόλγκερ Ρ. Ροθ ΑΛΒΑΡΚΟΥΝΙ ΑΛΒΑΡΚΟΥΝΙ Spyridon Bakas Mathieu N. Galtier Μπένετ Α. Λάντμαν Κλάους Μάιερ-Χέιν ΣΕΒΑΣΤΙΑΝ ΟΥΡΣΕΛΙΝ Μίκα Σέλερ Ρόναλντ Μ. Σάμερς Άντριου Τραμπ Ντάγκουανγκ Σου Μαξιμιλιανός Μπάουστ Τζορτζ Καρντόζο ΑΠΑΣΧΟΛΗΣΗ Η μηχανική μάθηση με βάση τα δεδομένα (ML) έχει προκύψει ως μια πολλά υποσχόμενη προσέγγιση για την οικοδόμηση ακριβών και ισχυρών στατιστικών μοντέλων από ιατρικά δεδομένα, τα οποία συλλέγονται σε τεράστιους όγκους από τα σύγχρονα συστήματα υγειονομικής περίθαλψης. Τα υπάρχοντα ιατρικά δεδομένα δεν αξιοποιούνται πλήρως από την ML κυρίως επειδή βρίσκεται σε σιλό δεδομένων και οι ανησυχίες για την προστασία της ιδιωτικής ζωής περιορίζουν την πρόσβαση σε αυτά τα δεδομένα. Ωστόσο, χωρίς πρόσβαση σε επαρκή δεδομένα, η ML θα εμποδιστεί να φτάσει στο πλήρες δυναμικό της και, τελικά, να κάνει τη μετάβαση από την έρευνα στην κλινική πρακτική. Introduction Έρευνα για την τεχνητή νοημοσύνη (AI), και ιδιαίτερα τις εξελίξεις στη μηχανική μάθηση (ML) και τη βαθιά μάθηση (DL) Τα σύγχρονα μοντέλα DL διαθέτουν εκατομμύρια παραμέτρους που πρέπει να μάθουν από επαρκώς μεγάλα συγκεντρωμένα δεδομένα για να επιτευχθεί κλινική ακρίβεια, ενώ είναι ασφαλή, δίκαια, δίκαια και γενικεύουν καλά σε αόρατα δεδομένα , , , . 1 2 3 4 5 For example, training an AI-based tumour detector requires a large database encompassing the full spectrum of possible anatomies, pathologies, and input data types. Data like this is hard to obtain, because health data is highly sensitive and its usage is tightly regulated . Even if data anonymisation could bypass these limitations, it is now well understood that removing metadata such as patient name or date of birth is often not enough to preserve privacy Για παράδειγμα, είναι δυνατόν να ανακατασκευαστεί το πρόσωπο ενός ασθενούς από δεδομένα υπολογιστικής τομογραφίας (CT) ή μαγνητικής τομογραφίας (MRI). Ένας άλλος λόγος για τον οποίο η ανταλλαγή δεδομένων δεν είναι συστηματική στην υγειονομική περίθαλψη είναι ότι η συλλογή, η συντήρηση και η συντήρηση ενός συνόλου δεδομένων υψηλής ποιότητας απαιτεί σημαντικό χρόνο, προσπάθεια και έξοδα. 6 7 8 Federated learning (FL) , , είναι ένα παράδειγμα μάθησης που επιδιώκει να αντιμετωπίσει το πρόβλημα της διακυβέρνησης των δεδομένων και της ιδιωτικής ζωής με την κατάρτιση αλγορίθμων συνεργατικά χωρίς την ανταλλαγή των ίδιων των δεδομένων. , πρόσφατα κέρδισε έλξη για εφαρμογές υγειονομικής περίθαλψης , , , , , , , . FL enables gaining insights collaboratively, e.g., in the form of a consensus model, without moving patient data beyond the firewalls of the institutions in which they reside. Instead, the ML process occurs locally at each participating institution and only model characteristics (e.g., parameters, gradients) are transferred as depicted in Fig. Πρόσφατες έρευνες έχουν δείξει ότι τα μοντέλα που εκπαιδεύονται από την FL μπορούν να επιτύχουν επίπεδα απόδοσης συγκρίσιμα με αυτά που εκπαιδεύονται σε κεντρικά φιλοξενούμενα σύνολα δεδομένων και ανώτερα από τα μοντέλα που βλέπουν μόνο απομονωμένα ενιαία θεσμικά δεδομένα , . 9 10 11 12 13 14 15 16 17 18 19 20 1 16 17 Συγκεντρωτικός διακομιστής FL – η τυπική ροή εργασίας FL στην οποία μια ομοσπονδία κόμβων εκπαίδευσης λαμβάνει το παγκόσμιο μοντέλο, υποβάλλει εκ νέου τα μερικώς εκπαιδευμένα μοντέλα τους σε έναν κεντρικό διακομιστή διαλείπουσα για συγκέντρωση και στη συνέχεια συνεχίζει την εκπαίδευση στο μοντέλο συναίνεσης που επιστρέφει ο διακομιστής. FL peer to peer - εναλλακτική διατύπωση του FL στην οποία κάθε κόμβος εκπαίδευσης ανταλλάσσει τα μερικώς εκπαιδευμένα μοντέλα του με μερικούς ή όλους τους ομολόγους του και ο καθένας κάνει τη δική του συγκέντρωση. Κεντρική κατάρτιση – η γενική ροή εργασίας κατάρτισης εκτός FL στην οποία οι τοποθεσίες που αποκτούν δεδομένα δωρίζουν τα δεδομένα τους σε μια κεντρική λίμνη δεδομένων από την οποία αυτοί και άλλοι μπορούν να εξάγουν δεδομένα για τοπική, ανεξάρτητη κατάρτιση. a b c A successful implementation of FL could thus hold a significant potential for enabling precision medicine at large-scale, leading to models that yield unbiased decisions, optimally reflect an individual’s physiology, and are sensitive to rare diseases while respecting governance and privacy concerns. However, FL still requires rigorous technical consideration to ensure that the algorithm is proceeding optimally without compromising safety or patient privacy. Nevertheless, it has the potential to overcome the limitations of approaches that require a single pool of centralised data. Προβλέπουμε ένα ομοσπονδιακό μέλλον για την ψηφιακή υγεία και με αυτό το έγγραφο προοπτικής, μοιραζόμαστε τη συναίνεσή μας με στόχο να παρέχουμε πλαίσιο και λεπτομέρειες για την κοινότητα σχετικά με τα οφέλη και τον αντίκτυπο της FL για ιατρικές εφαρμογές (κεφάλαιο «Η ιατρική που βασίζεται σε δεδομένα απαιτεί ομοσπονδιακές προσπάθειες»), καθώς και να υπογραμμίσουμε τις βασικές σκέψεις και προκλήσεις της εφαρμογής της FL για την ψηφιακή υγεία (κεφάλαιο «Τεχνικές σκέψεις»). Η ιατρική που βασίζεται σε δεδομένα απαιτεί ομοσπονδιακές προσπάθειες Ωστόσο, τα ιατρικά σύνολα δεδομένων είναι δύσκολο να ληφθούν (υποτμήμα «Η εξάρτηση από τα δεδομένα»). Η FL αντιμετωπίζει αυτό το ζήτημα επιτρέποντας τη συνεργατική μάθηση χωρίς να συγκεντρώνει δεδομένα (υποτμήμα «Η υπόσχεση της ομοσπονδιακής προσπάθειας») και έχει ήδη βρει το δρόμο της σε ψηφιακές εφαρμογές υγείας (υποτμήμα «Τρέχουσες προσπάθειες της FL για την ψηφιακή υγεία»). Η εξάρτηση από τα δεδομένα Data-driven approaches rely on data that truly represent the underlying data distribution of the problem. While this is a well-known requirement, state-of-the-art algorithms are usually evaluated on carefully curated data sets, often originating from only a few sources. This can introduce biases where demographics (e.g., gender, age) or technical imbalances (e.g., acquisition protocol, equipment manufacturer) skew predictions and adversely affect the accuracy for certain groups or sites. However, to capture subtle relationships between disease patterns, socio-economic and genetic factors, as well as complex and rare cases, it is crucial to expose a model to diverse cases. Η ανάγκη για μεγάλες βάσεις δεδομένων για την κατάρτιση της τεχνητής νοημοσύνης έχει οδηγήσει σε πολλές πρωτοβουλίες που επιδιώκουν να συγκεντρώσουν δεδομένα από πολλαπλά ιδρύματα.Τα δεδομένα αυτά συσσωρεύονται συχνά σε λεγόμενες Data Lakes. , or as a resource for economic growth and scientific progress, e.g., NHS Scotland’s National Safe Haven Γαλλικό κέντρο δεδομένων για την υγεία , and Health Data Research UK . 21 22 23 24 Σημαντικές, αν και μικρότερες, πρωτοβουλίες περιλαμβάνουν το Human Connectome , the UK Biobank Αρχείο Εικόνων Καρκίνου (Cancer Imaging Archive, TCIA) ΝΙΧ CXR8 ΝΕΑ ΒΑΘΜΙΣΜΑΤΑ Ο Άτλας του γονιδιώματος του καρκίνου (Cancer Genome Atlas, TCGA) Η πρωτοβουλία για τη νευροεικόνα της νόσου Αλτσχάιμερ (ADNI) Παράλληλα με τις μεγάλες ιατρικές προκλήσεις Η πρόκληση του Camelion Διεθνής Διαδικτυακή Διαίρεση Εγκέφαλου Όγκου (International Multimodal Brain Tumor Segmentation - BRATS) , , Η ιατρική διαίρεση Decathlon Τα δημόσια ιατρικά δεδομένα είναι συνήθως ειδικά για την εργασία ή την ασθένεια και συχνά απελευθερώνονται με διάφορους βαθμούς περιορισμών αδειοδότησης, μερικές φορές περιορίζοντας την εκμετάλλευσή τους. 25 26 27 28 29 30 31 32 33 34 35 36 37 Η συγκέντρωση ή η απελευθέρωση δεδομένων, ωστόσο, δεν θέτει μόνο ρυθμιστικές, ηθικές και νομικές προκλήσεις, που σχετίζονται με την προστασία της ιδιωτικής ζωής και των δεδομένων, αλλά και τεχνικές προκλήσεις.Η ανωνυμοποίηση, ο έλεγχος της πρόσβασης και η ασφαλή διαβίβαση δεδομένων υγείας είναι ένα μη τριπλό και μερικές φορές αδύνατο έργο. Το ίδιο ισχύει και για τα γονιδιακά δεδομένα και τις ιατρικές εικόνες που τα καθιστούν τόσο μοναδικά όσο τα δακτυλικά αποτυπώματα. Ως εκ τούτου, εκτός εάν η διαδικασία ανωνυμοποίησης καταστρέψει την πιστότητα των δεδομένων, πιθανώς καθιστώντας τα άχρηστα, δεν μπορεί να αποκλειστεί η επαναπροσδιορισμός του ασθενούς ή η διαρροή πληροφοριών.Η πρόσβαση μέσω πύλης για τους εγκεκριμένους χρήστες συχνά προτείνεται ως υποτιθέμενη λύση σε αυτό το πρόβλημα.Ωστόσο, εκτός από τον περιορισμό της διαθεσιμότητας των δεδομένων, αυτό είναι πρακτικό μόνο για περιπτώσεις στις οποίες η συγκατάθεση που χορηγήθηκε από τους κατόχους των δεδομένων είναι άνευ όρων, δεδομένου ότι η ανάκληση δεδομένων από εκείνους που ενδέχεται να είχαν πρόσβαση στα δεδομένα είναι πρακτικά αδύνατη. 7 38 Η υπόσχεση των ομοσπονδιακών προσπαθειών Η υπόσχεση της FL είναι απλή – να αντιμετωπίσει τις προκλήσεις της προστασίας της ιδιωτικής ζωής και της διακυβέρνησης των δεδομένων, επιτρέποντας την ML από μη-co-located δεδομένα. Σε μια ρύθμιση FL, κάθε υπεύθυνος επεξεργασίας δεδομένων όχι μόνο καθορίζει τις δικές του διαδικασίες διακυβέρνησης και τις σχετικές πολιτικές προστασίας δεδομένων, αλλά ελέγχει επίσης την πρόσβαση σε δεδομένα και έχει τη δυνατότητα να την ανακαλέσει. Αυτό περιλαμβάνει τόσο την εκπαίδευση όσο και τη φάση επικύρωσης. Με αυτόν τον τρόπο, η FL θα μπορούσε να δημιουργήσει νέες ευκαιρίες, π.χ. επιτρέποντας την μεγάλης κλίμακας, θεσμική επικύρωση ή επιτρέποντας νέα έρευνα σε σπάνιες ασθένειες, όπου τα ποσοστά Όπως αναφέρεται στο Fig. , μια ροή εργασίας FL μπορεί να πραγματοποιηθεί με διαφορετικές τοπολογίες και υπολογιστικά σχέδια. τα δύο πιο κοινά για εφαρμογές υγειονομικής περίθαλψης είναι μέσω ενός διακομιστή συγκέντρωσης , , Πήγαινε στο Peer to Peer , Σε όλες τις περιπτώσεις, η FL παρέχει σιωπηρά ένα ορισμένο βαθμό ιδιωτικότητας, καθώς οι συμμετέχοντες της FL δεν έχουν ποτέ άμεση πρόσβαση σε δεδομένα από άλλα ιδρύματα και λαμβάνουν μόνο παραμέτρους μοντέλου που συγκεντρώνονται σε διάφορους συμμετέχοντες. , , , Ως εκ τούτου, μηχανισμοί όπως η διαφοροποιημένη ιδιωτικότητα , or learning from encrypted data have been proposed to further enhance privacy in a FL setting (c.f. section “Technical considerations”). Overall, the potential of FL for healthcare applications has sparked interest in the community και οι τεχνικές FL είναι ένας αναπτυσσόμενος τομέας έρευνας , . 2 16 17 18 15 39 40 41 42 43 44 45 46 12 20 FL topologies—communication architecture of a federation. Κεντρικός: ο διακομιστής συγκέντρωσης συντονίζει τις επαναλήψεις εκπαίδευσης και συλλέγει, συγκεντρώνει και διανέμει τα μοντέλα προς και από τους κόμβους εκπαίδευσης (Hub & Spoke). Αποκεντρωμένος: Κάθε κόμβος εκπαίδευσης συνδέεται με έναν ή περισσότερους ομολόγους και η συγκέντρωση συμβαίνει σε κάθε κόμβο παράλληλα. Ιεραρχικό: τα ομοσπονδιακά δίκτυα μπορούν να αποτελούνται από διάφορες υποομοσπονδίες, οι οποίες μπορούν να κατασκευαστούν από ένα μείγμα ομοσπονδιών Peer to Peer και Aggregation Server ( FL υπολογιστικά σχέδια – τροχιά ενός μοντέλου σε διάφορους εταίρους. Διαδοχική Εκπαίδευση / Κυκλική Μεταφορά Μάθησης. Συγκέντρωση διακομιστών, Peer to Peer. a b c d e f g Οι τρέχουσες προσπάθειες της FL για την ψηφιακή υγεία Δεδομένου ότι το FL είναι ένα γενικό παράδειγμα μάθησης που αφαιρεί την απαίτηση συγκέντρωσης δεδομένων για την ανάπτυξη μοντέλων AI, το εύρος εφαρμογών του FL καλύπτει ολόκληρη την AI για την υγειονομική περίθαλψη. παρέχοντας την ευκαιρία να συλλάβει μεγαλύτερη μεταβλητότητα δεδομένων και να αναλύει τους ασθενείς σε διαφορετικά δημογραφικά στοιχεία, το FL μπορεί να επιτρέψει ανατρεπτικές καινοτομίες για το μέλλον, αλλά χρησιμοποιείται επίσης τώρα. Στο πλαίσιο των ηλεκτρονικών αρχείων υγείας (EHR), για παράδειγμα, το FL βοηθά στην εκπροσώπηση και την εύρεση κλινικά παρόμοιων ασθενών. , , as well as predicting hospitalisations due to cardiac events Θνησιμότητα και χρόνος παραμονής ICU Η εφαρμογή και τα πλεονεκτήματα του FL έχουν επίσης αποδειχθεί στον τομέα της ιατρικής απεικόνισης, για ολόκληρο το τμήμα του εγκεφάλου σε MRI , καθώς και η διαίρεση όγκου του εγκεφάλου , Πρόσφατα, η τεχνική έχει χρησιμοποιηθεί για την ταξινόμηση fMRI για να βρεθούν αξιόπιστοι βιοδείκτες που σχετίζονται με ασθένειες. and suggested as a promising approach in the context of COVID-19 . 13 47 14 19 15 16 17 18 48 Αξίζει να σημειωθεί ότι οι προσπάθειες της FL απαιτούν συμφωνίες για τον καθορισμό του πεδίου εφαρμογής, του στόχου και των τεχνολογιών που χρησιμοποιούνται, οι οποίες, δεδομένου ότι είναι ακόμα νέες, μπορεί να είναι δύσκολο να προσδιοριστούν. Αυτές περιλαμβάνουν κοινοπραξίες που στοχεύουν στην προώθηση research, such as the Trustworthy Federated Data Analytics (TFDA) project and the German Cancer Consortium’s Joint Imaging Platform , τα οποία επιτρέπουν την αποκεντρωμένη έρευνα σε γερμανικά ερευνητικά ιδρύματα ιατρικής απεικόνισης. Ένα άλλο παράδειγμα είναι μια διεθνής ερευνητική συνεργασία που χρησιμοποιεί FL για την ανάπτυξη μοντέλων AI για την αξιολόγηση των μαστογραφιών . The study showed that the FL-generated models outperformed those trained on a single institute’s data and were more generalisable, so that they still performed well on other institutes’ data. However, FL is not limited just to academic environments. academic 49 50 51 Με τη σύνδεση των ιδρυμάτων υγειονομικής περίθαλψης, που δεν περιορίζονται σε ερευνητικά κέντρα, η FL μπορεί να έχει άμεση impact. The on-going HealthChain project , για παράδειγμα, στοχεύει να αναπτύξει και να αναπτύξει ένα πλαίσιο FL σε τέσσερα νοσοκομεία στη Γαλλία. Αυτή η λύση δημιουργεί κοινά μοντέλα που μπορούν να προβλέψουν την απόκριση της θεραπείας για τους ασθενείς με καρκίνο του μαστού και μελάνωμα. Βοηθά τους ογκολόγους να καθορίσουν την πιο αποτελεσματική θεραπεία για κάθε ασθενή από τις ιστολογικές τους διαφάνειες ή τις εικόνες δερμοσκόπησης. , η οποία είναι μια διεθνής ομοσπονδία 30 δεσμευμένων ιδρυμάτων υγειονομικής περίθαλψης που χρησιμοποιούν ένα πλαίσιο FL ανοιχτού κώδικα με γραφική διεπαφή χρήστη. ο στόχος είναι να βελτιωθεί η ανίχνευση ορίων όγκου, συμπεριλαμβανομένου του γλιομά του εγκεφάλου, των όγκων του μαστού, των όγκων του ήπατος και των βλαβών των οστών από ασθενείς με πολλαπλά μυελομά. clinical 52 53 Ένας άλλος τομέας επιρροής είναι η έρευνα και μετάφραση. FL επιτρέπει τη συνεργατική έρευνα για, ακόμη και ανταγωνιστικές εταιρείες. Σε αυτό το πλαίσιο, μία από τις μεγαλύτερες πρωτοβουλίες είναι το έργο Melloddy . It is a project aiming to deploy multi-task FL across the data sets of 10 pharmaceutical companies. By training a common predictive model, which infers how chemical compounds bind to proteins, partners intend to optimise the drug discovery process without revealing their highly valuable in-house data. Βιομηχανική 54 Impact on stakeholders Η FL περιλαμβάνει μια αλλαγή παραδείγματος από τις κεντρικές λίμνες δεδομένων και είναι σημαντικό να κατανοήσουμε τον αντίκτυπό της στους διάφορους ενδιαφερόμενους φορείς σε ένα οικοσύστημα FL. Clinicians Οι κλινικοί ιατροί εκτίθενται συνήθως σε μια υποομάδα του πληθυσμού με βάση την τοποθεσία και το δημογραφικό περιβάλλον τους, γεγονός που μπορεί να προκαλέσει προκατειλημμένες υποθέσεις σχετικά με την πιθανότητα ορισμένων ασθενειών ή τη διασύνδεσή τους. Χρησιμοποιώντας συστήματα που βασίζονται σε ML, π.χ. ως δεύτερο αναγνώστη, μπορούν να αυξήσουν την εμπειρογνωμοσύνη τους με εμπειρογνωμοσύνη από άλλα ιδρύματα, εξασφαλίζοντας μια συνεκτικότητα της διάγνωσης που δεν μπορεί να επιτευχθεί σήμερα. Ενώ αυτό ισχύει για το σύστημα που βασίζεται σε ML γενικά, τα συστήματα που εκπαιδεύονται με ομοσπονδιακό τρόπο είναι δυνητικά ικανά να παράγουν ακόμη λιγότερο προκατειλημμένες αποφάσεις και Patients Οι ασθενείς συνήθως αντιμετωπίζονται τοπικά. Η καθιέρωση της FL σε παγκόσμια κλίμακα θα μπορούσε να εξασφαλίσει υψηλής ποιότητας κλινικές αποφάσεις ανεξάρτητα από τον τόπο θεραπείας. Ειδικότερα, οι ασθενείς που χρειάζονται ιατρική φροντίδα σε απομακρυσμένες περιοχές θα μπορούσαν να επωφεληθούν από τις ίδιες υψηλής ποιότητας διαγνώσεις με βοήθεια ML που είναι διαθέσιμες σε νοσοκομεία με μεγάλο αριθμό περιπτώσεων. Το ίδιο ισχύει για σπάνιες ή γεωγραφικά ασυνήθιστες ασθένειες, οι οποίες είναι πιθανό να έχουν πιο ήπιες συνέπειες εάν μπορούν να γίνουν ταχύτερες και ακριβέστερες διαγνώσεις. Hospitals and practices Hospitals and practices can remain in full control and possession of their patient data with complete traceability of data access, limiting the risk of misuse by third parties. However, this will require investment in on-premise computing infrastructure or private-cloud service provision and adherence to standardised and synoptic data formats so that ML models can be trained and evaluated seamlessly. The amount of necessary compute capability depends of course on whether a site is only participating in evaluation and testing efforts or also in training efforts. Even relatively small institutions can participate and they will still benefit from collective models generated. Ερευνητές και προγραμματιστές Οι ερευνητές και οι προγραμματιστές τεχνητής νοημοσύνης επωφελούνται από την πρόσβαση σε μια δυνητικά τεράστια συλλογή πραγματικών δεδομένων, η οποία θα έχει σίγουρα αντίκτυπο σε μικρότερα ερευνητικά εργαστήρια και νεοσύστατες επιχειρήσεις. Έτσι, οι πόροι μπορούν να κατευθυνθούν προς την επίλυση κλινικών αναγκών και συναφών τεχνικών προβλημάτων αντί να βασίζονται στην περιορισμένη προσφορά ανοικτών συνόλων δεδομένων. , , Η ανάπτυξη με βάση το FL συνεπάγεται επίσης ότι ο ερευνητής ή ο προγραμματιστής τεχνητής νοημοσύνης δεν μπορεί να ερευνήσει ή να απεικονίσει όλα τα δεδομένα στα οποία εκπαιδεύεται το μοντέλο, για παράδειγμα, δεν είναι δυνατόν να εξετάσουμε μια μεμονωμένη περίπτωση αποτυχίας για να καταλάβουμε γιατί το τρέχον μοντέλο λειτουργεί άσχημα σε αυτό. 11 12 20 Προμηθευτές Υγείας Οι πάροχοι υγειονομικής περίθαλψης σε πολλές χώρες επηρεάζονται από τη συνεχιζόμενη μετατόπιση του παραδείγματος από την υπηρεσία βάσει όγκου, δηλαδή με βάση την αμοιβή ανά υπηρεσία, στην υπηρεσία υγείας βάσει αξίας, η οποία με τη σειρά της συνδέεται στενά με την επιτυχή εγκαθίδρυση της ιατρικής ακριβείας. δεν πρόκειται για την προώθηση πιο δαπανηρών εξατομικευμένων θεραπειών, αλλά για την επίτευξη καλύτερων αποτελεσμάτων νωρίτερα μέσω πιο εστιασμένης θεραπείας, μειώνοντας έτσι το κόστος. Κατασκευαστές Οι κατασκευαστές λογισμικού και υλικού υγειονομικής περίθαλψης θα μπορούσαν επίσης να επωφεληθούν από την FL, καθώς ο συνδυασμός της μάθησης από πολλές συσκευές και εφαρμογές, χωρίς να αποκαλύπτονται συγκεκριμένες πληροφορίες για τον ασθενή, μπορεί να διευκολύνει τη συνεχή επικύρωση ή βελτίωση των συστημάτων ML. Τεχνικές Σκέψεις FL is perhaps best-known from the work of Konečnỳ et al. , but various other definitions have been proposed in the literature , , , Μια ροή εργασίας (Fig. ) μπορούν να πραγματοποιηθούν μέσω διαφορετικών τοπολογιών και υπολογιστικών σχεδίων (Σχήμα. Σε αυτή την ενότητα, θα συζητήσουμε λεπτομερέστερα τι είναι το FL, καθώς και τονίζοντας τις βασικές προκλήσεις και τεχνικές εκτιμήσεις που προκύπτουν κατά την εφαρμογή του FL στην ψηφιακή υγεία. 55 9 11 12 20 1 2 Ορισμός της ομοσπονδιακής μάθησης FL is a learning paradigm in which multiple parties train collaboratively without the need to exchange or centralise data sets. A general formulation of FL reads as follows: Let denote a global loss function obtained via a weighted combination of local losses , computed from private data , η οποία κατοικεί στα μεμονωμένα ενδιαφερόμενα μέρη και δεν μοιράζεται ποτέ μεταξύ τους: K XΚ Που > 0 υποδεικνύει τους αντίστοιχους συντελεστές βάρους. ΓΚ Στην πράξη, κάθε συμμετέχων συνήθως αποκτά και τελειοποιεί ένα παγκόσμιο μοντέλο συναίνεσης διεξάγοντας μερικούς γύρους βελτιστοποίησης τοπικά και πριν από την κοινή χρήση των ενημερώσεων, είτε απευθείας είτε μέσω ενός διακομιστή παραμέτρων. ) , Η πραγματική διαδικασία για τη συγκέντρωση των παραμέτρων εξαρτάται από την τοπολογία του δικτύου, καθώς οι κόμβοι ενδέχεται να διαχωριστούν σε υποδίκτυα λόγω γεωγραφικών ή νομικών περιορισμών (βλ. Εικόνα 4.1). ). Aggregation strategies can rely on a single aggregating node (hub and spokes models), or on multiple nodes without any centralisation. An example is peer-to-peer FL, where connections exist between all or a subset of the participants and model updates are shared only between directly connected sites , Σημειώστε ότι οι στρατηγικές συγκέντρωσης δεν απαιτούν απαραίτητα πληροφορίες σχετικά με την πλήρη ενημέρωση του μοντέλου. οι πελάτες μπορεί να επιλέξουν να μοιραστούν μόνο ένα υποσύνολο των παραμέτρων του μοντέλου για λόγους μείωσης της επικοινωνίας, εξασφαλίζοντας καλύτερη διατήρηση της ιδιωτικής ζωής. or to produce multi-task learning algorithms having only part of their parameters learned in a federated manner. 1 9 12 2 15 56 10 Ένα ενοποιητικό πλαίσιο που επιτρέπει διάφορα προγράμματα κατάρτισης μπορεί να αποσυνδέσει τους υπολογιστικούς πόρους (δεδομένα και διακομιστές) από το Όπως αναφέρεται στο Fig. . The latter defines the trajectory of a model across several partners, to be trained and evaluated on specific data sets. Υπολογιστικά Σχέδια 2 Challenges and considerations Despite the advantages of FL, it does not solve all issues that are inherent to learning on medical data. A successful model training still depends on factors like data quality, bias and standardisation Αυτά τα ζητήματα πρέπει να επιλυθούν τόσο για τις ομοσπονδιακές όσο και για τις μη ομοσπονδιακές προσπάθειες μάθησης μέσω κατάλληλων μέτρων, όπως προσεκτικός σχεδιασμός μελέτης, κοινά πρωτόκολλα για την απόκτηση δεδομένων, δομημένη αναφορά και εξελιγμένες μεθοδολογίες για την ανακάλυψη προκαταλήψεων και κρυφής διαστρωμάτωσης. , , . 2 11 12 20 Η ετερογένεια των δεδομένων Medical data is particularly diverse—not only because of the variety of modalities, dimensionality and characteristics in general, but even within a specific protocol due to factors such as acquisition differences, brand of the medical device or local demographics. FL may help address certain sources of bias through potentially increased diversity of data sources, but inhomogeneous data distribution poses a challenge for FL algorithms and strategies, as many are assuming independently and identically distributed (IID) data across the participants. In general, strategies such as είναι επιρρεπείς στην αποτυχία υπό αυτές τις συνθήκες , , , in part defeating the very purpose of collaborative learning strategies. Recent results, however, indicate that FL training is still feasible , ακόμη και αν τα ιατρικά δεδομένα δεν κατανέμονται ομοιόμορφα σε όλα τα ιδρύματα , ή περιλαμβάνει μια τοπική προδιάθεση Η έρευνα για την αντιμετώπιση αυτού του προβλήματος περιλαμβάνει, για παράδειγμα, Στρατηγική μερικής ανταλλαγής δεδομένων και FL με προσαρμογή domain Μια άλλη πρόκληση είναι ότι η ετερογένεια των δεδομένων μπορεί να οδηγήσει σε μια κατάσταση στην οποία η παγκόσμια βέλτιστη λύση μπορεί να μην είναι βέλτιστη για έναν μεμονωμένο τοπικό συμμετέχοντα. ΦΕΔΑΒΓ 9 9 57 58 59 16 17 51 ΦΕΔΠΡΟΣ 57 58 18 Privacy and security Τα δεδομένα υγείας είναι ιδιαίτερα ευαίσθητα και πρέπει να προστατεύονται αναλόγως, ακολουθώντας τις κατάλληλες διαδικασίες εμπιστευτικότητας. Privacy vs. performance: It is important to note that FL does not solve all potential privacy issues and—similar to ML algorithms in general—will always carry some risks. Privacy-preserving techniques for FL offer levels of protection that exceed today’s current commercially available ML models . However, there is a trade-off in terms of performance and these techniques may affect, for example, the accuracy of the final model Επιπλέον, μελλοντικές τεχνικές ή/και παρεπόμενα δεδομένα θα μπορούσαν να χρησιμοποιηθούν για να υπονομεύσουν ένα μοντέλο που προηγουμένως θεωρούνταν χαμηλού κινδύνου. 12 10 Επίπεδο εμπιστοσύνης: Γενικά, τα συμμετέχοντα μέρη μπορούν να εισέλθουν σε δύο τύπους συνεργασίας FL: —για τις κοινοπραξίες FL στις οποίες όλα τα μέρη θεωρούνται αξιόπιστα και δεσμεύονται από μια εκτελεστή συμφωνία συνεργασίας, μπορούμε να εξαλείψουμε πολλά από τα πιο επιζήμια κίνητρα, όπως οι σκόπιμες προσπάθειες εξαγωγής ευαίσθητων πληροφοριών ή η σκόπιμη διαφθορά του μοντέλου. Trusted —Στα συστήματα FL που λειτουργούν σε μεγαλύτερη κλίμακα, μπορεί να μην είναι πρακτικό να δημιουργηθεί μια εκτελεστή συμφωνία συνεργασίας. Μερικοί πελάτες ενδέχεται να προσπαθήσουν σκόπιμα να υποβαθμίσουν την απόδοση, να μειώσουν το σύστημα ή να εξαγάγουν πληροφορίες από άλλα μέρη. Ως εκ τούτου, θα απαιτηθούν στρατηγικές ασφαλείας για τον μετριασμό αυτών των κινδύνων, όπως η προηγμένη κρυπτογράφηση των υποβολών μοντέλων, η ασφαλή ταυτοποίηση όλων των μερών, η ιχνηλασιμότητα των ενεργειών, το διαφορικό απόρρητο, τα συστήματα επαλήθευσης, η ακεραιότητα εκτέλεσης, η εμπιστευτικότητα του μοντέλου και η προστασία Non-trusted Διαρροή πληροφοριών: Από ορισμό, τα συστήματα FL αποφεύγουν την ανταλλαγή δεδομένων υγειονομικής περίθαλψης μεταξύ των συμμετεχόντων ιδρυμάτων. Ωστόσο, οι κοινές πληροφορίες μπορεί ακόμα να εκθέσουν έμμεσα τα ιδιωτικά δεδομένα που χρησιμοποιούνται για τοπική εκπαίδευση, π.χ. με αντιστροφή μοντέλου από τα μοντέλα ενημερώσεων, οι ίδιοι οι κλίμακες Οι αντίπαλες επιθέσεις , . FL is different from traditional training insofar as the training process is exposed to multiple parties, thereby increasing the risk of leakage via reverse-engineering if adversaries can observe model changes over time, observe specific model updates (i.e., a single institution’s update), or manipulate the model (e.g., induce additional memorisation by others through gradient-ascent-style attacks). Developing counter-measures, such as limiting the granularity of the updates and adding noise , and ensuring adequate differential privacy μπορεί να χρειαστεί και παραμένει ενεργός τομέας έρευνας . 60 61 62 63 16 18 44 12 ιχνηλασιμότητα και λογοδοσία Όπως συμβαίνει με όλες τις κρίσιμες για την ασφάλεια εφαρμογές, η αναπαραγωγικότητα ενός συστήματος είναι σημαντική για την FL στην υγειονομική περίθαλψη. Σε αντίθεση με την κεντρική εκπαίδευση, η FL απαιτεί πολλαπλούς υπολογισμούς σε περιβάλλοντα που παρουσιάζουν σημαντική ποικιλία όσον αφορά το υλικό, το λογισμικό και τα δίκτυα. Η ιχνηλασιμότητα όλων των περιουσιακών στοιχείων του συστήματος, συμπεριλαμβανομένου του ιστορικού πρόσβασης σε δεδομένα, των διαμορφώσεων εκπαίδευσης και της προσαρμογής υπερπαραμέτρων σε όλες τις διαδικασίες εκπαίδευσης είναι επομένως υποχρεωτική. Ειδικά σε μη αξιόπιστες ομοσπονδίες, η ιχνηλασιμότητα και οι διαδικασίες λογοδοσίας . One implication of FL is that researchers are not able to investigate data upon which models are being trained to make sense of unexpected results. Moreover, taking statistical measurements of their training data as part of the model development workflow will need to be approved by the collaborating parties as not violating privacy. Although each site will have access to its own raw data, federations may decide to provide some sort of secure intra-node viewing facility to cater for this need or may provide some other way to increase explainability and interpretability of the global model. 64 Αρχιτεκτονική συστήματος Unlike running large-scale FL amongst consumer devices such as McMahan et al. Οι συμμετέχοντες στα ιδρύματα υγειονομικής περίθαλψης είναι εξοπλισμένοι με σχετικά ισχυρούς υπολογιστικούς πόρους και αξιόπιστα δίκτυα υψηλότερης ροής που επιτρέπουν την κατάρτιση μεγαλύτερων μοντέλων με πολλά περισσότερα τοπικά βήματα κατάρτισης και την ανταλλαγή περισσότερων πληροφοριών μοντέλου μεταξύ των κόμβων.Αυτά τα μοναδικά χαρακτηριστικά του FL στην υγειονομική περίθαλψη φέρνουν επίσης προκλήσεις όπως η εξασφάλιση της ακεραιότητας των δεδομένων κατά την επικοινωνία με τη χρήση αναλώσιμων κόμβων, ο σχεδιασμός ασφαλών μεθόδων κρυπτογράφησης για την πρόληψη διαρροής δεδομένων ή ο σχεδιασμός κατάλληλων προγραμματιστών κόμβων για την καλύτερη αξιοποίηση των κατα 9 Η διαχείριση μιας τέτοιας ομοσπονδίας μπορεί να πραγματοποιηθεί με διαφορετικούς τρόπους. Σε καταστάσεις που απαιτούν την αυστηρότερη προστασία των δεδομένων μεταξύ των μερών, η εκπαίδευση μπορεί να λειτουργήσει μέσω κάποιου είδους συστήματος «εντιμότερου μεσίτη», στο οποίο ένας αξιόπιστος τρίτος ενεργεί ως ενδιάμεσος και διευκολύνει την πρόσβαση στα δεδομένα. Αυτή η ρύθμιση απαιτεί μια ανεξάρτητη οντότητα που ελέγχει το συνολικό σύστημα, η οποία μπορεί να μην είναι πάντοτε επιθυμητή, δεδομένου ότι θα μπορούσε να συνεπάγεται πρόσθετο κόστος και διαδικαστική ιξώδες. Ωστόσο, έχει το πλεονέκτημα ότι οι ακριβείς εσωτερικοί μηχανισμοί μπορούν να αφηγηθούν μακριά από τους πελάτες, καθιστώντας Συμπέρασμα Η ML, και ιδιαίτερα η DL, έχει οδηγήσει σε ένα ευρύ φάσμα καινοτομιών στον τομέα της ψηφιακής υγειονομικής περίθαλψης. Καθώς όλες οι μέθοδοι ML επωφελούνται σε μεγάλο βαθμό από την ικανότητα πρόσβασης σε δεδομένα που προσεγγίζουν την πραγματική παγκόσμια διανομή, η FL είναι μια ελπιδοφόρα προσέγγιση για την απόκτηση ισχυρών, ακριβών, ασφαλών, ανθεκτικών και αμερόληπτων μοντέλων. Επιτρέποντας σε πολλαπλά μέρη να εκπαιδεύσουν συνεργατικά χωρίς να χρειάζεται να ανταλλάξουν ή να συγκεντρώσουν σύνολα δεδομένων, η FL αντιμετωπίζει απαλά ζητήματα που σχετίζονται με την έξοδο ευαίσθητων ιατρικών δεδομένων. Ως αποτέλεσμα Παρ 'όλα αυτά, πιστεύουμε πραγματικά ότι ο δυνητικός αντίκτυπός του στην ιατρική ακριβείας και τελικά στη βελτίωση της ιατρικής περίθαλψης είναι πολύ ελπιδοφόρος. 12 Συνοπτική αναφορά Further information on research design is available in the συνδέεται με αυτό το άρθρο. Επισκόπηση της έρευνας για τη φύση Αναφορές LeCun, Y., Bengio, Y. & Hinton, G. Deep learning. , 436 (2015). Nature 521 Wang, F., Casalino, L. P. & Khullar, D. Deep learning in medicine—promise, progress, and challenges. , 293–294 (2019). JAMA Intern. Med. 179 Chartrand, G. et al. Deep learning: a primer for radiologists. , 2113–2131 (2017). Radiographics 37 De Fauw, J. et al. Clinically applicable deep learning for diagnosis and referral in retinal disease. , 1342 (2018). Nat. Med. 24 Sun, C., Shrivastava, A., Singh, S. & Gupta, A. Revisiting unreasonable effectiveness of data in deep learning era. In , 843–852 ( , 2017). Proceedings of the IEEE international conference on computer vision IEEE Van Panhuis, W. G. et al. A systematic review of barriers to data sharing in public health. , 1144 (2014). BMC Public Health 14 Rocher, L., Hendrickx, J. M. & De Montjoye, Y.-A. Estimating the success of re-identifications in incomplete datasets using generative models. , 1–9 (2019). Nat. Commun. 10 Schwarz, C. G. et al. Identification of anonymous mri research participants with face-recognition software. , 1684–1686 (2019). N. Engl. J. Med. 381 McMahan, B., Moore, E., Ramage, D., Hampson, S. & y Arcas, B. A. Communication-efficient learning of deep networks from decentralized data. In , 1273–1282. (2017). Artificial Intelligence and Statistics https://scholar.google.de/scholar?hl=de&as_sdt=0%2C5&q=Communicationefficient+learning+of+deep+networks+from+decentralized+data&btnG= Li, T., Sahu, A. K., Talwalkar, A. & Smith, V. Federated learning: Challenges, methods, and future directions. , 50–60 (IEEE, 2020). IEEE Signal Processing Magazine 37 Yang, Q., Liu, Y., Chen, T. & Tong, Y. Federated machine learning: concept and applications. , 12 (2019). ACM Trans. Intell. Syst. Technol. (TIST) 10 Kairouz, P. et al. Advances and open problems in federated learning. (2019). arXiv preprint arXiv:1912.04977 Lee, J. et al. Privacy-preserving patient similarity learning in a federated environment: development and analysis. , e20 (2018). JMIR Med. Inform. 6 Brisimi, T. S. et al. Federated learning of predictive models from federated electronic health records. , 59–67 (2018). Int. J. Med. Inform. 112 Roy, A. G., Siddiqui, S., Pölsterl, S., Navab, N. & Wachinger, C. Braintorrent: a peer-to-peer environment for decentralized federated learning. (2019). arXiv preprint arXiv:1905.06731 Li, W. et al. Privacy-preserving federated brain tumour segmentation. In , 133–141 (Springer, 2019). International Workshop on Machine Learning in Medical Imaging Sheller, M. J., Reina, G. A., Edwards, B., Martin, J. & Bakas, S. Multi-institutional deep learning modeling without sharing patient data: a feasibility study on brain tumor segmentation. In , 92–104 (Springer, 2018). International MICCAI Brainlesion Workshop Li, X. et al. Multi-site fmri analysis using privacy-preserving federated learning and domain adaptation: abide results. (2020). arXiv preprint arXiv:2001.05647 Huang, L. et al. Patient clustering improves efficiency of federated machine learning to predict mortality and hospital stay time using distributed electronic medical records. , 103291 (2019). J. Biomed. Inform. 99 Xu, J. & Wang, F. Federated learning for healthcare informatics. (2019). arXiv preprint arXiv:1911.06270 Roy, A. & Banerjee, A. Ibm’s merge healthcare acquisitio . (2015) (Accessed 10 February 2020). n https://www.reuters.com/article/us-merge-healthcare-m-a-ibm/ibm-to-buy-merge-healthcare-in-1-billion-deal-idUSKCN0QB1ML20150806 Nhs scotland’s national safe haven. (2015) (Accessed 10 February 2020). https://www.gov.scot/publications/charter-safe-havens-scotland-handling-unconsented-data-national-health-service-patient-records-support-research-statistics/pages/4/ Cuggia, M. & Combes, S. The french health data hub and the german medical informatics initiatives: Two national projects to promote data sharing in healthcare. , 195–202 (2019). Yearbook Med. Informat. 28 Health Data Research UK. (Health Data Research UK, 2020) (Accessed 10 Feb 2020). https://www.hdruk.ac.uk/ Sporns, O., Tononi, G. & Kötter, R. The human connectome: a structural description of the human brain. . , e42, (2005). PLoS Comput. Biol 1 https://doi.org/10.1371/journal.pcbi.0010042 Sudlow, C. et al. Uk biobank: an open access resource for identifying the causes of a wide range of complex diseases of middle and old age. . , e1001779. (2015). PLoS Med 12 https://doi.org/10.1371/journal.pmed.1001779 Clark, K. et al. The cancer imaging archive (tcia): maintaining and operating a public information repository. , 1045–1057 (2013). J. Digit. Imaging. 26 Wang, X. et al. Chestx-ray8: Hospital-scale chest X-ray database and benchmarks on weakly-supervised classification and localization of common thorax diseases. In , 2097–2106 ( , 2017). Proceedings of the IEEE conference on computer vision and pattern recognition IEEE Yan, K., Wang, X., Lu, L. & Summers, R. M. Deeplesion: automated mining of large-scale lesion annotations and universal lesion detection with deep learning. , 036501 (2018). J Med. Imaging. 5 Tomczak, K., Czerwińska, P. & Wiznerowicz, M. The cancer genome atlas (tcga): an immeasurable source of knowledge. , A68 (2015). Contemp. Oncol. 19 Jack Jr., C. R. et al. The alzheimer’s disease neuroimaging initiative (adni): Mri methods. , 685–691 (2008). J. Magn. Reson. Imaging 27 . (2020) (Accessed 24 July 2020). Grand Challenge-a Platform for End-to-end Development of Machine Learning Solutions in Biomedical Imaging https://grand-challenge.org/ Litjens, G. et al. 1399 h&e-stained sentinel lymph node sections of breast cancer patients: the camelyon dataset. , giy065 (2018). GigaScience 7 Menze, B. H. et al. The multimodal brain tumor image segmentation benchmark (brats). , 1993–2024 (2014). IEEE Trans. Med. Imaging 34 Bakas, S. et al. Identifying the best machine learning algorithms for brain tumor segmentation, progression assessment, and overall survival prediction in the brats challenge. (2018). arXiv preprint arXiv:1811.02629 Bakas, S. et al. Advancing the cancer genome atlas glioma MRI collections with expert segmentation labels and radiomic features. , 170117 (2017). Sci. Data 4 Simpson, A. L. et al. A large annotated medical image dataset for the development and evaluation of segmentation algorithms. (2019). arXiv preprint arXiv:1902.09063 Yeh, F.-C. et al. Quantifying differences and similarities in whole-brain white matter architecture using local connectome fingerprints. , e1005203 (2016). PLoS Comput. Biol. 12 Chang, K. et al. Distributed deep learning networks among institutions for medical imaging. , 945–954 (2018). J. Am. Med. Inform. Assoc. 25 Shokri, R., Stronati, M., Song, C. & Shmatikov, V. Membership inference attacks against machine learning models. In , 3-18 (IEEE, 2017). 2017 IEEE Symposium on Security and Privacy (SP) Sablayrolles, A., Douze, M., Ollivier, Y., Schmid, C. & Jégou, H. White-box vs black-box: Bayes optimal strategies for membership inference. In Chaudhuri, K. & Salakhutdinov, R. (eds) , 5558–5567. (PMLR, 2019). Proceedings of the 36th International Conference on Machine Learning, {ICML} 97 http://proceedings.mlr.press/v97/sablayrolles19a.html Zhang, C., Bengio, S., Hardt, M., Recht, B. & Vinyals, O. Understanding deep learning requires rethinking generalization. In , (OpenReview.net, 2017). 5th International Conference on Learning Representations, {ICLR}. https://openreview.net/forum?id=Sy8gdB9xx Carlini, N., Liu, C., Erlingsson, Ú., Kos, J. & Song, D. The secret sharer: evaluating and testing unintended memorization in neural networks. In Heninger, N. & Traynor, P. (eds) { } ({ } , 267–284. ({USENIX} Association, Santa Clara, CA, USA, 2019). 28th USENIX Security Symposium USENIX Security 19 https://www.usenix.org/conference/usenixsecurity19/presentation/carlini Abadi, M. et al. Deep learning with differential privacy. In , 308–318 (ACM, 2016). Proceedings of the 2016 ACM SIGSAC Conference on Computer and Communications Security Shokri, R. & Shmatikov, V. Privacy-preserving deep learning. In , 1310–1321 (ACM, 2015). Proceedings of the 22nd ACM SIGSAC conference on computer and communications security Langlotz, C. P. et al. A roadmap for foundational research on artificial intelligence in medical imaging: from the 2018 nih/rsna/acr/the academy workshop. , 781–791 (2019). Radiology 291 Kim, Y., Sun, J., Yu, H. & Jiang, X. Federated Tensor Factorization for Computational Phenotyping. In . 887–895. (ACM, Halifax, NS, Canada, 2017). Proceedings of the 23rd {ACM} {SIGKDD} International Conference on Knowledge Discoveryand Data Mining https://doi.org/10.1145/3097983.3098118 He, C., Annavaram, M. & Avestimehr, S. Fednas: Federated deep learning via neural architecture search. (2020). https://sites.google.com/view/cvpr20-nas/ Trustworthy federated data analytics (tfda). (2020) (Accessed 28 May 2020). https://tfda.hmsp.center/ Joint Imaging Platform (Jip). (2020) (Accessed 28 May 2020). https://jip.dktk.dkfz.de/jiphomepage/ Medical institutions collaborate to improve mammogram assessment ai. (2020) (Accessed 28 May 2020). https://blogs.nvidia.com/blog/2020/04/15/federated-learning-mammogram-assessment/ Healthchain consortium. (2020) (Accessed 28 May 2020). https://www.substra.ai/en/healthchain-project The federated tumor segmentation (fets) initiative. (2020) (Accessed 28 May 2020). https://www.fets.ai Machine learning ledger orchestration for drug discovery. (2020). Accessed 28 May 2020. https://cordis.europa.eu/project/id/831472 Konečny`, J., McMahan, H. B., Ramage, D. & Richtárik, P. Federated optimization: Distributed machine learning for on-device intelligence. (2016). arXiv preprint arXiv:1610.02527 Lalitha, A., Kilinc, O. C., Javidi, T. & Koushanfar, F. Peer-to-peer federated learning on graphs. (2019). arXiv preprint arXiv:1901.11173 Li, T., Sahu, A. K., Zaheer, M., Sanjabi, M., Talwalkar, A. & Smith, V. Federated optimization in heterogeneous networks. (2018). arXiv preprint arXiv:1812.06127 Zhao, Y. et al. Federated learning with non-iid data. (2018). arxivabs/1806.00582 Li, X., Huang, K., Yang, W., Wang, S. & Zhang, Z. On the convergence of fedavg on non-IID data. (2020). https://openreview.net/forum?id=HJxNAnVtDS Wu, B. et al. P3sgd: patient privacy preserving SGD for regularizing deep CNNs in pathological image classification. In (pp. 2099–2108) (2019). Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition Zhu, L., Liu, Z. & Han, S. Deep leakage from gradients. In Wallach, H. M. et al. (eds) , 14747–14756. (2019). Advances in Neural Information Processing Systems 32: Annual Conference on Neural Information Processing Systems http://papers.nips.cc/paper/9617-deep-leakage-from-gradients Wang, Z. et al. Beyond inferring class representatives: user-level privacy leakage from federated learning. In 2512–2520. (IEEE, Paris, France, 2019). 2019 {IEEE} Conferenceon Computer Communications, {INFOCOM} https://doi.org/10.1109/INFOCOM.2019.8737416 Hitaj, B., Ateniese, G. & Perez-Cruz, F. Deep models under the gan: information leakage from collaborative deep learning. In , CCS’17, 603–618 (Association for Computing Machinery, New York, NY, USA, 2017). Proceedings of the 2017 ACM SIGSAC Conference on Computer and Communications Security Ghorbani, A. & Zou, J. Data shapley: Equitable valuation of data for machine learning. In (pp. 2242-2251) (2019). International Conference on Machine Learning Αναγνώριση Η εργασία αυτή υποστηρίχθηκε από το Κέντρο Έρευνας και Καινοτομίας του Ηνωμένου Βασιλείου για την Ιατρική Εικόνα και την Τεχνητή Νοημοσύνη του Λονδίνου για την Κλινική Υγεία με βάση την αξία, από το Κέντρο Ιατρικής Μηχανικής Wellcome/EPSRC (WT203148/Z/16/Z), από το Εμβληματικό Πρόγραμμα Wellcome (WT213038/Z/18/Z), από το Εμβληματικό Πρόγραμμα Έρευνας και Δίκτυο Helmholtz του Κλινικού Κέντρου Εθνικών Ινστιτούτων Υγείας (NIH), από το Εθνικό Ινστιτούτο Καρκίνου της Γερμανικής Ακαδημαϊκής Υπηρεσίας Ανταλλαγής (DAAD) με το This paper is under CC by 4.0 Deed (Attribution 4.0 International) license. available on nature This paper is Υπό την άδεια CC by 4.0 Deed (Attribution 4.0 International). Διαθέσιμο στη φύση