tác giả:
(1) Shadab Ahamed, Đại học British Columbia, Vancouver, BC, Canada, Viện Nghiên cứu Ung thư BC, Vancouver, BC, Canada. Anh ấy cũng là Thành viên tăng tốc của Mitacs (tháng 5 năm 2022 - tháng 4 năm 2023) với Microsoft AI cho Good Lab, Redmond, WA, USA (e-mail: [email protected]);
(2) Yixi Xu, Microsoft AI cho Good Lab, Redmond, WA, USA;
(3) Claire Gowdy, Bệnh viện Nhi đồng BC, Vancouver, BC, Canada;
(4) Joo H. O, Bệnh viện St. Mary, Seoul, Hàn Quốc;
(5) Ingrid Bloise, BC Cancer, Vancouver, BC, Canada;
(6) Don Wilson, BC Cancer, Vancouver, BC, Canada;
(7) Patrick Martineau, BC Cancer, Vancouver, BC, Canada;
(8) Francois Benard, BC Cancer, Vancouver, BC, Canada;
(9) Fereshteh Yousefirizi, Viện Nghiên cứu Ung thư BC, Vancouver, BC, Canada;
(10) Rahul Dodhia, Microsoft AI cho Good Lab, Redmond, WA, Hoa Kỳ;
(11) Juan M. Lavista, Microsoft AI cho Good Lab, Redmond, WA, USA;
(12) William B. Weeks, Microsoft AI cho Good Lab, Redmond, WA, USA;
(13) Carlos F. Uribe, Viện Nghiên cứu Ung thư BC, Vancouver, BC, Canada và Đại học British Columbia, Vancouver, BC, Canada;
(14) Arman Rahmim, Viện Nghiên cứu Ung thư BC, Vancouver, BC, Canada và Đại học British Columbia, Vancouver, BC, Canada.
Nhiều công trình đã khám phá việc ứng dụng các phương pháp học sâu để phân đoạn ung thư hạch trên ảnh PET/CT. Nguyên và cộng sự. [4] đã phát triển một kỹ thuật tổng hợp tính năng để sử dụng thông tin bổ sung từ dữ liệu đa phương thức. Hu và cộng sự. [5] đề xuất kết hợp một sự kết hợp giữa ResUNet 3D được đào tạo về dữ liệu thể tích và ba ResUNet 2D được đào tạo trên các lát 2D từ ba hướng trực giao để nâng cao hiệu suất phân đoạn. Li và cộng sự. [6] đề xuất DenseX-Net được đào tạo theo kiểu từ đầu đến cuối tích hợp các phương pháp được giám sát và không giám sát để phát hiện và phân đoạn ung thư hạch. Lưu và cộng sự. [7] đã giới thiệu các kỹ thuật như tăng cường mẫu âm tính dựa trên bản vá và hướng dẫn nhãn để đào tạo Residual-UNet 3D để phân đoạn ung thư hạch. Hạn chế lớn của tất cả các tác phẩm này là chúng được phát triển trên các tập dữ liệu có kích thước tương đối nhỏ hơn (dưới 100 hình ảnh). Hơn nữa, hầu hết các phương pháp này không so sánh hiệu quả của các phương pháp được đề xuất với các tiêu chuẩn cơ bản khác hoặc với hiệu quả của các bác sĩ.
Constantino và cộng sự. [8] đã so sánh hiệu suất của 7 phương pháp phân đoạn bán tự động và 2 phương pháp phân đoạn học sâu, trong khi Weisman et al. [9] đã so sánh 11 kỹ thuật phân đoạn tự động, mặc dù cả hai nghiên cứu này đều được thực hiện trên các tập dữ liệu nhỏ hơn có kích thước tương ứng là 65 và 90. Weisman và cộng sự. [10] đã so sánh hiệu suất phân đoạn của phương pháp 3D Deep Medic tự động với phương pháp của bác sĩ mặc dù nghiên cứu này chỉ bao gồm 90 trường hợp ung thư hạch. Ngoại trừ [10], không có nghiên cứu nào trong số này báo cáo sự khái quát hóa mô hình trên tập dữ liệu ngoài phân phối (chẳng hạn như trên dữ liệu được thu thập từ các trung tâm khác nhau), hạn chế việc định lượng độ tin cậy và giá trị bên ngoài của chúng. Giang và cộng sự. [11] đã sử dụng bộ dữ liệu tương đối lớn hơn so với các nghiên cứu trên với 297 hình ảnh để huấn luyện UNet 3D. Họ thậm chí còn thực hiện thử nghiệm ngoài phân phối trên 117 hình ảnh được thu thập từ một trung tâm khác. Theo hiểu biết tốt nhất của chúng tôi, bộ dữ liệu PET/CT ung thư hạch lớn nhất để phân đoạn tổn thương dựa trên học sâu từng được báo cáo là công trình của Blanc-Durand et al. [12] người đã sử dụng 639 hình ảnh để phát triển mô hình và 94 hình ảnh để thử nghiệm bên ngoài; tuy nhiên, nghiên cứu này chỉ sử dụng các số liệu đánh giá phân khúc tiêu chuẩn và đánh giá khả năng dự đoán TMTV chính xác của mô hình của họ. Cả hai nghiên cứu [11] và [12] đều bị hạn chế bởi thực tế là bộ dữ liệu của họ chỉ bao gồm các bệnh nhân được chẩn đoán mắc bệnh ung thư hạch tế bào B lớn lan tỏa (DLBCL), chỉ đại diện cho một loại ung thư hạch duy nhất.
Hầu hết các nghiên cứu hiện có về phân đoạn ung thư hạch dựa trên học sâu đều báo cáo hiệu suất của chúng dựa trên các số liệu phân đoạn chung như hệ số tương tự xúc xắc (DSC), giao điểm trên liên kết (IoU), độ nhạy, v.v. Khi có các tổn thương phân đoạn lớn, rất tổn thương nhỏ bị bỏ sót hoặc dương tính giả nhỏ không đóng góp nhiều vào giá trị DSC. Do đó, cần phải báo cáo số lượng dương tính giả và âm tính giả. Cũng sẽ có ích khi đánh giá hiệu suất phát hiện trên cơ sở từng tổn thương (số thành phần được kết nối được phát hiện và bị bỏ sót), vì việc phát hiện tự động ngay cả một vài điểm ảnh ba chiều của tất cả các tổn thương có thể giúp bác sĩ nhanh chóng xác định các vùng quan tâm, ngay cả khi DSC ở mức thấp. Hơn nữa, độ khó của nhiệm vụ phân đoạn/phát hiện thường không được đánh giá thông qua phân tích thỏa thuận giữa các quan sát viên hoặc nội bộ.
Nghiên cứu của chúng tôi nhằm mục đích giải quyết những hạn chế này. Chúng tôi đã đào tạo và xác nhận bốn mạng lưới thần kinh sâu trên bộ dữ liệu PET/CT ung thư hạch từ ba đoàn hệ, bao gồm hai loại ung thư hạch riêng biệt: DLBCL và ung thư hạch tế bào B lớn trung thất nguyên phát (PMBCL). (i) Chúng tôi đã thực hiện cả trong (hình ảnh đến từ cùng một nhóm với tập huấn luyện/xác thực) và thử nghiệm ngoài phân phối hoặc bên ngoài (hình ảnh từ nhóm thứ tư không được sử dụng để đào tạo/xác thực) để đánh giá độ tin cậy của các mô hình của chúng tôi. (ii) Chúng tôi đã báo cáo hiệu suất sử dụng DSC, số lượng dương tính giả và âm tính giả, đồng thời đánh giá sự phụ thuộc hiệu suất vào sáu loại biện pháp tổn thương khác nhau. (iii) Chúng tôi cũng đã đánh giá khả năng các mạng của chúng tôi tái tạo các biện pháp tổn hại thực tế cơ bản này và lỗi của các mạng được tính toán trong việc dự đoán chúng. (iv) Chúng tôi đã đề xuất ba loại tiêu chí phát hiện cho trường hợp sử dụng của mình và đánh giá hiệu suất của mô hình dựa trên các số liệu này. (v) Cuối cùng, chúng tôi đã đánh giá thỏa thuận nội bộ và giữa những người quan sát để đưa ra thước đo về mức độ khó của nhiệm vụ phân đoạn tổn thương trên tập dữ liệu của chúng tôi.
Bài viết này có sẵn trên arxiv theo giấy phép CC 4.0.