Yazarlar:
(1) Shadab Ahamed, British Columbia Üniversitesi, Vancouver, BC, Kanada, BC Kanser Araştırma Enstitüsü, Vancouver, BC, Kanada. Ayrıca Microsoft AI for Good Lab, Redmond, WA, ABD'de Mitacs Hızlandırma Üyesi (Mayıs 2022 - Nisan 2023) olarak görev yaptı (e-posta: [email protected]);
(2) Yixi Xu, Good Lab için Microsoft AI, Redmond, WA, ABD;
(3) Claire Gowdy, BC Çocuk Hastanesi, Vancouver, BC, Kanada;
(4) Joo H. O, St. Mary's Hastanesi, Seul, Kore Cumhuriyeti;
(5) Ingrid Bloise, BC Cancer, Vancouver, BC, Kanada;
(6) Don Wilson, BC Cancer, Vancouver, BC, Kanada;
(7) Patrick Martineau, BC Cancer, Vancouver, BC, Kanada;
(8) François Benard, BC Cancer, Vancouver, BC, Kanada;
(9) Fereshteh Yousefirizi, BC Kanser Araştırma Enstitüsü, Vancouver, BC, Kanada;
(10) Rahul Dodhia, Good Lab için Microsoft AI, Redmond, WA, ABD;
(11) Juan M. Lavista, Microsoft AI for Good Lab, Redmond, WA, ABD;
(12) William B. Weeks, Good Lab için Microsoft AI, Redmond, WA, ABD;
(13) Carlos F. Uribe, BC Kanser Araştırma Enstitüsü, Vancouver, BC, Kanada ve British Columbia Üniversitesi, Vancouver, BC, Kanada;
(14) Arman Rahmim, BC Kanser Araştırma Enstitüsü, Vancouver, BC, Kanada ve British Columbia Üniversitesi, Vancouver, BC, Kanada.
Çok sayıda çalışma, PET/CT görüntülerinde lenfomayı segmentlere ayırmak için derin öğrenme yöntemlerinin uygulanmasını araştırdı. Yuan ve diğerleri. [4] çok modlu verilerden tamamlayıcı bilgilerden faydalanmak için bir özellik birleştirme tekniği geliştirdi. Hu ve ark. [5], segmentasyon performansını arttırmak için hacimsel veriler üzerinde eğitilmiş 3D ReSUNet ile üç ortogonal yönden 2D dilimler üzerinde eğitilmiş üç 2D ReSUNet kombinasyonunun birleştirilmesini önerdi. Li ve diğerleri. [6], lenfoma tespiti ve segmentasyonu için denetimli ve denetimsiz yöntemleri entegre eden uçtan uca eğitilmiş DenseX-Net'i önerdi. Liu ve diğerleri. [7], lenfoma segmentasyonu için bir 3D Residual-UNet'in eğitimi için yama bazlı negatif örnek büyütme ve etiket rehberliği gibi teknikleri tanıttı. Tüm bu çalışmaların en büyük sınırlaması, nispeten daha küçük boyutlu veri kümeleri (100 görüntüden az) üzerinde geliştirilmiş olmalarıydı. Üstelik bu yöntemlerin çoğu, önerilen yöntemlerin performansını diğer referanslarla veya doktorların performansıyla karşılaştırmadı.
Constantino ve ark. [8] 7 yarı otomatik ve 2 derin öğrenme segmentasyon yönteminin performanslarını karşılaştırırken Weisman ve ark. [9] 11 otomatik segmentasyon tekniğini karşılaştırdı, ancak bu çalışmaların her ikisi de sırasıyla 65 ve 90 boyutunda daha küçük veri kümeleri üzerinde yapıldı. Weisman ve ark. [10] otomatik 3D Deep Medic yönteminin segmentasyon performanslarını hekiminkiyle karşılaştırdı, ancak bu çalışma bile sadece 90 lenfoma vakasını içeriyordu. [10] dışında, bu çalışmaların hiçbiri dağıtım dışı veri setinde (farklı merkezlerden toplanan veriler gibi) model genellemesi rapor etmemiş, bu da onların sağlamlık niceliğini ve dış geçerliliğini sınırlamıştır. Jiang ve diğerleri. [11], 3D UNet'i eğitmek için 297 görüntü içeren yukarıdaki çalışmalara kıyasla nispeten daha büyük bir veri seti kullandı. Hatta farklı bir merkezden toplanan 117 görüntü üzerinde dağıtım dışı testler bile yaptılar. Bildiğimiz kadarıyla derin öğrenmeye dayalı lezyon segmentasyonu için şimdiye kadar bildirilen en büyük lenfoma PET/CT veri seti Blanc-Durand ve ark.'nın çalışmasıdır. [12] model geliştirme için 639, harici test için 94 görüntü kullanan; ancak bu çalışmada yalnızca standart segmentasyon değerlendirme ölçümleri kullanılmış ve modellerinin doğru TMTV'yi tahmin etme yeteneği değerlendirilmiştir. Hem çalışmalar [11] hem de [12], veri setlerinin sadece lenfomanın tek bir alt tipini temsil eden diffüz büyük B hücreli lenfoma (DLBCL) tanısı alan hastalardan oluşması gerçeğiyle sınırlıdır.
Derin öğrenmeye dayalı lenfoma segmentasyonuna ilişkin mevcut çalışmaların çoğu, Dice benzerlik katsayısı (DSC), kesişim-over-birleşim (IoU), duyarlılık vb. gibi genel segmentasyon metriklerine ilişkin performanslarını bildirmektedir. Büyük segmentli lezyonların varlığında, çok gözden kaçan küçük lezyonlar veya küçük yanlış pozitifler DSC değerine çok fazla katkıda bulunmaz. Bu nedenle, yanlış pozitif ve yanlış negatiflerin miktarının rapor edilmesine ihtiyaç vardır. Ayrıca, tüm lezyonların birkaç vokselinin bile otomatik olarak saptanması, doktorların ilgilenilen bölgeleri hızlı bir şekilde bulmasına yardımcı olabileceğinden, tespit performanslarının lezyon bazında (tespit edilen bağlı bileşenlerin sayısı ve kaçırılan) değerlendirilmesi de yararlı olacaktır. DSC düşük. Ayrıca, bölümlendirme/tespit görevinin zorluğu genellikle gözlemciler arası veya gözlemciler arası anlaşma analizi yoluyla değerlendirilmez.
Çalışmamız bu sınırlamaları gidermeyi amaçlamaktadır. İki farklı lenfoma alt tipini kapsayan üç kohorttan lenfoma PET/CT veri kümeleri üzerinde dört derin sinir ağını eğittik ve doğruladık: DLBCL ve primer mediastinal büyük B hücreli lenfoma (PMBCL). (i) Modellerimizin sağlamlığını değerlendirmek için hem (eğitim/doğrulama seti ile aynı kohortlardan gelen görüntüler) hem de dağıtım dışı veya harici (eğitim/doğrulama için kullanılmayan dördüncü bir kohorttan gelen görüntüler) testleri gerçekleştirdik. (ii) Performansı DSC kullanarak, yanlış pozitif ve negatif hacimlerini rapor ettik ve performansın altı farklı tipte lezyon ölçümüne bağımlılığını değerlendirdik. (iii) Ayrıca ağlarımızın bu temel gerçeklik lezyonu ölçümlerini yeniden üretme yeteneğini ve bilgisayarlı ağların bunları tahmin etme hatasını da değerlendirdik. (iv) Kullanım durumumuz için üç tür tespit kriteri önerdik ve modelin performansını bu ölçümlere göre değerlendirdik. (v) Son olarak, veri setlerimizdeki lezyon segmentasyonu görevinin zorluğunun bir ölçüsünü vermek için gözlemciler arası ve gözlemciler arası anlaşmayı değerlendirdik.
Bu makale arxiv'de CC 4.0 lisansı altında mevcuttur .