Tác giả:
(1) Shadab Ahamed, Đại học British Columbia, Vancouver, BC, Canada, Viện Nghiên cứu Ung thư BC, Vancouver, BC, Canada. Anh cũng là Thành viên tăng tốc của Mitacs (tháng 5 năm 2022 - tháng 4 năm 2023) với Microsoft AI for Good Lab, Redmond, WA, USA (e-mail: [email protected]);
(2) Yixi Xu, Microsoft AI cho Good Lab, Redmond, WA, USA;
(3) Claire Gowdy, Bệnh viện Nhi đồng BC, Vancouver, BC, Canada;
(4) Joo H. O, Bệnh viện St. Mary, Seoul, Hàn Quốc;
(5) Ingrid Bloise, BC Cancer, Vancouver, BC, Canada;
(6) Don Wilson, BC Cancer, Vancouver, BC, Canada;
(7) Patrick Martineau, BC Cancer, Vancouver, BC, Canada;
(8) Francois Benard, BC Cancer, Vancouver, BC, Canada;
(9) Fereshteh Yousefirizi, Viện Nghiên cứu Ung thư BC, Vancouver, BC, Canada;
(10) Rahul Dodhia, Microsoft AI cho Good Lab, Redmond, WA, Hoa Kỳ;
(11) Juan M. Lavista, Microsoft AI cho Good Lab, Redmond, WA, USA;
(12) William B. Weeks, Microsoft AI cho Good Lab, Redmond, WA, USA;
(13) Carlos F. Uribe, Viện Nghiên cứu Ung thư BC, Vancouver, BC, Canada và Đại học British Columbia, Vancouver, BC, Canada;
(14) Arman Rahmim, Viện Nghiên cứu Ung thư BC, Vancouver, BC, Canada và Đại học British Columbia, Vancouver, BC, Canada.
Nghiên cứu này thực hiện đánh giá toàn diện bốn kiến trúc mạng lưới thần kinh (UNet, SegResNet, DynUNet và SwinUNETR) để phân đoạn tổn thương ung thư hạch từ hình ảnh PET/CT. Các mạng này đã được đào tạo, xác nhận và thử nghiệm trên bộ dữ liệu đa dạng, đa tổ chức gồm 611 trường hợp. Thử nghiệm nội bộ (88 trường hợp; tổng thể tích khối u chuyển hóa (TMTV) trong phạm vi [0,52, 2300] ml) cho thấy SegResNet là công cụ có hiệu suất cao nhất với hệ số tương tự Dice trung bình (DSC) là 0,76 và thể tích dương tính giả trung bình (FPV) là 4,55 ml; tất cả các mạng đều có thể tích âm tính giả trung bình (FNV) là 0 ml. Trên bộ thử nghiệm bên ngoài không nhìn thấy (145 trường hợp có phạm vi TMTV: [0,10, 2480] ml), SegResNet đạt được DSC trung bình tốt nhất là 0,68 và FPV là 21,46 ml, trong khi UNet có FNV tốt nhất là 0,41 ml. Chúng tôi đã đánh giá khả năng tái lập của sáu biện pháp tổn thương, tính toán các lỗi dự đoán của chúng và kiểm tra hiệu suất của DSC liên quan đến các biện pháp tổn thương này, đưa ra những hiểu biết sâu sắc về độ chính xác của phân đoạn và mức độ phù hợp lâm sàng. Ngoài ra, chúng tôi đã giới thiệu ba tiêu chí phát hiện tổn thương, giải quyết nhu cầu lâm sàng trong việc xác định tổn thương, đếm chúng và phân đoạn dựa trên các đặc điểm trao đổi chất. Chúng tôi cũng đã thực hiện phân tích độ biến thiên của người quan sát nội bộ của chuyên gia, cho thấy những thách thức trong việc phân chia các trường hợp “dễ” và “khó”, để hỗ trợ phát triển các thuật toán phân đoạn linh hoạt hơn. Cuối cùng, chúng tôi đã thực hiện đánh giá thỏa thuận giữa những người quan sát để nhấn mạnh tầm quan trọng của giao thức phân đoạn sự thật cơ bản được tiêu chuẩn hóa liên quan đến nhiều chuyên gia chú thích. Mã có sẵn tại: https://github.com/microsoft/lymphoma-segmentationdnn .
Thuật ngữ chỉ mục - Chụp cắt lớp phát xạ Positron, chụp cắt lớp vi tính, học sâu, phân đoạn, phát hiện, đo lường tổn thương, biến thiên trong người quan sát, biến thiên giữa người quan sát
Hình ảnh PET/CT F LUORODEOXYGLUCOSE (18F-FDG) là tiêu chuẩn chăm sóc cho bệnh nhân ung thư hạch, cung cấp các chẩn đoán, phân giai đoạn và đánh giá đáp ứng điều trị chính xác. Tuy nhiên, những đánh giá định tính truyền thống, như điểm Deauville [1], có thể gây ra sự khác biệt do tính chủ quan của người quan sát trong việc diễn giải hình ảnh. Sử dụng phân tích PET định lượng kết hợp các biện pháp tổn thương như giá trị hấp thu tiêu chuẩn hóa trung bình của tổn thương (SUVmean), tổng thể tích khối u chuyển hóa (TMTV) và phương pháp glycolysis tổng tổn thương (TLG) mang lại một hướng đi đầy hứa hẹn cho các quyết định tiên lượng đáng tin cậy hơn, nâng cao khả năng dự đoán bệnh nhân của chúng tôi. kết quả điều trị ung thư hạch với độ chính xác và độ tin cậy cao hơn [2].
Đánh giá định lượng trong hình ảnh PET/CT thường dựa vào việc phân đoạn tổn thương thủ công, việc này tốn nhiều thời gian và dễ có sự biến đổi trong nội bộ và giữa những người quan sát. Các kỹ thuật tự động dựa trên ngưỡng truyền thống có thể bỏ sót bệnh có mức hấp thu thấp và tạo ra kết quả dương tính giả ở những vùng có mức hấp thu chất đánh dấu phóng xạ cao về mặt sinh lý. Do đó, deep learning hứa hẹn sẽ tự động hóa việc phân chia tổn thương, giảm tính biến đổi, tăng số lượng bệnh nhân và có khả năng hỗ trợ phát hiện các tổn thương khó khăn [3].
Mặc dù đầy hứa hẹn nhưng các phương pháp deep learning cũng phải đối mặt với những thách thức riêng. Mạng thần kinh tích chập (CNN) yêu cầu các bộ dữ liệu lớn, được chú thích rõ ràng và khó có thể lấy được. Các mô hình được đào tạo trên các tập dữ liệu nhỏ có thể không có tính khái quát hóa. Hơn nữa, các tổn thương ung thư hạch có sự khác biệt đáng kể về kích thước, hình dạng và hoạt động trao đổi chất, khiến việc huấn luyện mạng lưới sâu trở nên khó khăn một cách chính xác trong trường hợp không có các mục tiêu được xác định rõ ràng. Học sâu nhằm mục đích giảm tính biến thiên của người quan sát, nhưng các chú thích thủ công không nhất quán được sử dụng để đào tạo có thể dẫn đến lỗi tồn tại. Hiểu được những thách thức này là rất quan trọng để khai thác toàn bộ tiềm năng của các phương pháp này trong phân tích định lượng PET/CT.
Bài viết này có sẵn trên arxiv theo giấy phép CC 4.0.