Auteur:
(1) Shadab Ahamed, Université de la Colombie-Britannique, Vancouver, Colombie-Britannique, Canada, BC Cancer Research Institute, Vancouver, Colombie-Britannique, Canada. Il a également été Mitacs Accelerate Fellow (mai 2022 - avril 2023) auprès de Microsoft AI for Good Lab, Redmond, WA, États-Unis (e-mail : [email protected]) ;
(2) Yixi Xu, Microsoft AI for Good Lab, Redmond, WA, États-Unis ;
(3) Claire Gowdy, Hôpital pour enfants de la Colombie-Britannique, Vancouver, Colombie-Britannique, Canada ;
(4) Joo H. O, St. Mary's Hospital, Séoul, République de Corée ;
(5) Ingrid Bloise, BC Cancer, Vancouver, Colombie-Britannique, Canada ;
(6) Don Wilson, BC Cancer, Vancouver, Colombie-Britannique, Canada ;
(7) Patrick Martineau, BC Cancer, Vancouver, Colombie-Britannique, Canada ;
(8) François Benard, BC Cancer, Vancouver, BC, Canada ;
(9) Fereshteh Yousefirizi, BC Cancer Research Institute, Vancouver, Colombie-Britannique, Canada ;
(10) Rahul Dodhia, Microsoft AI for Good Lab, Redmond, WA, États-Unis ;
(11) Juan M. Lavista, Microsoft AI for Good Lab, Redmond, WA, États-Unis ;
(12) William B. Weeks, Microsoft AI for Good Lab, Redmond, WA, États-Unis ;
(13) Carlos F. Uribe, BC Cancer Research Institute, Vancouver, Colombie-Britannique, Canada, et Université de la Colombie-Britannique, Vancouver, Colombie-Britannique, Canada ;
(14) Arman Rahmim, BC Cancer Research Institute, Vancouver, BC, Canada, et Université de la Colombie-Britannique, Vancouver, BC, Canada.
Cette étude effectue une évaluation complète de quatre architectures de réseaux neuronaux (UNet, SegResNet, DynUNet et SwinUNETR) pour la segmentation des lésions de lymphome à partir d'images TEP/CT. Ces réseaux ont été formés, validés et testés sur un ensemble de données diversifiées et multi-institutionnelles de 611 cas. Les tests internes (88 cas ; plage de volume métabolique total de la tumeur (TMTV) [0,52, 2 300] ml) ont montré que SegResNet était le plus performant avec un coefficient de similarité Dice (DSC) médian de 0,76 et un volume médian de faux positifs (FPV) de 4,55 ml ; tous les réseaux avaient un volume médian de faux négatifs (FNV) de 0 ml. Sur l'ensemble de tests externes invisibles (145 cas avec plage TMTV : [0,10, 2480] ml), SegResNet a obtenu le meilleur DSC médian de 0,68 et un FPV de 21,46 ml, tandis qu'UNet avait le meilleur FNV de 0,41 ml. Nous avons évalué la reproductibilité de six mesures de lésions, calculé leurs erreurs de prédiction et examiné les performances du DSC par rapport à ces mesures de lésions, offrant ainsi un aperçu de l'exactitude de la segmentation et de la pertinence clinique. De plus, nous avons introduit trois critères de détection des lésions, répondant au besoin clinique d'identifier les lésions, de les compter et de les segmenter en fonction des caractéristiques métaboliques. Nous avons également effectué une analyse experte de la variabilité intra-observateur révélant les défis liés à la segmentation des cas « faciles » par rapport aux cas « difficiles », afin de contribuer au développement d'algorithmes de segmentation plus résilients. Enfin, nous avons effectué une évaluation de l'accord inter-observateur, soulignant l'importance d'un protocole standardisé de segmentation de la vérité terrain impliquant plusieurs annotateurs experts. Le code est disponible sur : https://github.com/microsoft/lymphoma-segmentationdnn .
Termes de l'index — Tomographie par émission de positons, tomodensitométrie, apprentissage profond, segmentation, détection, mesures des lésions, variabilité intra-observateur, variabilité inter-observateur
L'imagerie TEP/TDM au F LUORODÉOXYGLUCOSE (18F-FDG) est la norme de soins pour les patients atteints de lymphome, fournissant des diagnostics, une stadification et une évaluation précis de la réponse thérapeutique. Cependant, les évaluations qualitatives traditionnelles, comme les scores de Deauville [1], peuvent introduire une variabilité due à la subjectivité de l'observateur dans l'interprétation des images. L'utilisation d'une analyse TEP quantitative qui intègre des mesures de lésion telles que la valeur moyenne d'absorption standardisée de la lésion (SUVmean), le volume métabolique total de la tumeur (TMTV) et la glycolyse totale de la lésion (TLG) offre une voie prometteuse vers des décisions pronostiques plus fiables, améliorant notre capacité à prédire le patient. résultats dans le lymphome avec plus de précision et de confiance [2].
L'évaluation quantitative en imagerie TEP/CT repose souvent sur la segmentation manuelle des lésions, qui prend du temps et est sujette à des variabilités intra et inter-observateurs. Les techniques automatisées traditionnelles basées sur le seuillage peuvent passer à côté d’une maladie à faible absorption et produire des faux positifs dans les régions où l’absorption physiologique des radiotraceurs est élevée. Par conséquent, l’apprentissage profond est prometteur pour automatiser la segmentation des lésions, réduire la variabilité, augmenter le nombre de patients et potentiellement faciliter la détection de lésions difficiles [3].
Bien que prometteuses, les méthodes d’apprentissage profond sont confrontées à leurs propres défis. Les réseaux de neurones convolutifs (CNN) nécessitent des ensembles de données volumineux et bien annotés qui peuvent être difficiles à obtenir. Les modèles formés sur de petits ensembles de données peuvent ne pas être généralisables. De plus, les lésions du lymphome varient considérablement en taille, en forme et en activité métabolique, ce qui rend difficile la formation précise de réseaux profonds en l’absence d’antécédents bien définis. L'apprentissage profond vise à réduire la variabilité des observateurs, mais des annotations manuelles incohérentes utilisées pour la formation peuvent conduire à la perpétuation des erreurs. Comprendre ces défis est crucial pour exploiter tout le potentiel de ces méthodes dans l’analyse quantitative PET/CT.
Cet article est disponible sur arxiv sous licence CC 4.0.