paint-brush
Глубокие нейронные сети для обнаружения и количественной оценки поражений лимфомой: соответствующая работак@reinforcement

Глубокие нейронные сети для обнаружения и количественной оценки поражений лимфомой: соответствующая работа

Слишком долго; Читать

В этом исследовании проводится всесторонняя оценка четырех архитектур нейронных сетей для сегментации поражений лимфомы на изображениях ПЭТ/КТ.
featured image - Глубокие нейронные сети для обнаружения и количественной оценки поражений лимфомой: соответствующая работа
Reinforcement Technology Advancements HackerNoon profile picture
0-item

Авторы:

(1) Шадаб Ахамед, Университет Британской Колумбии, Ванкувер, Британская Колумбия, Канада, Институт онкологических исследований Британской Колумбии, Ванкувер, Британская Колумбия, Канада. Он также был научным сотрудником Mitacs Accelerate (май 2022 г. – апрель 2023 г.) в Microsoft AI for Good Lab, Редмонд, Вашингтон, США (электронная почта: [email protected]);

(2) Иси Сюй, Microsoft AI for Good Lab, Редмонд, Вашингтон, США;

(3) Клэр Гауди, Детская больница Британской Колумбии, Ванкувер, Британская Колумбия, Канада;

(4) Джу Х. О, Больница Святой Марии, Сеул, Республика Корея;

(5) Ингрид Блуаз, Британская Колумбия, Рак, Ванкувер, Британская Колумбия, Канада;

(6) Дон Уилсон, Британская Колумбия, Рак, Ванкувер, Британская Колумбия, Канада;

(7) Патрик Мартино, Британская Колумбия, Рак, Ванкувер, Британская Колумбия, Канада;

(8) Франсуа Бенар, Британская Колумбия, Рак, Ванкувер, Британская Колумбия, Канада;

(9) Ферештех Юсефиризи, Институт онкологических исследований Британской Колумбии, Ванкувер, Британская Колумбия, Канада;

(10) Рахул Додиа, Microsoft AI for Good Lab, Редмонд, Вашингтон, США;

(11) Хуан М. Лависта, Microsoft AI for Good Lab, Редмонд, Вашингтон, США;

(12) Уильям Б. Уикс, Microsoft AI for Good Lab, Редмонд, Вашингтон, США;

(13) Карлос Ф. Урибе, Институт онкологических исследований Британской Колумбии, Ванкувер, Британская Колумбия, Канада, и Университет Британской Колумбии, Ванкувер, Британская Колумбия, Канада;

(14) Арман Рахмим, Институт онкологических исследований Британской Колумбии, Ванкувер, Британская Колумбия, Канада, и Университет Британской Колумбии, Ванкувер, Британская Колумбия, Канада.

Таблица ссылок

II. СВЯЗАННЫХ С РАБОТОЙ

В многочисленных работах изучалось применение методов глубокого обучения для сегментации лимфомы на изображениях ПЭТ/КТ. Юань и др. [4] разработали метод объединения признаков для использования дополнительной информации из мультимодальных данных. Ху и др. [5] предложили объединить комбинацию 3D ResUNet, обученной на объемных данных, и трех 2D ResUNet, обученных на 2D-срезах из трех ортогональных направлений, для повышения производительности сегментации. Ли и др. [6] предложили DenseX-Net, обученную сквозным способом, интегрирующим контролируемые и неконтролируемые методы обнаружения и сегментации лимфом. Лю и др. [7] представили такие методы, как увеличение негативных образцов на основе патчей и руководство по маркировке для обучения 3D Residual-UNet для сегментации лимфомы. Основным ограничением всех этих работ было то, что они разрабатывались на наборах данных относительно меньшего размера (менее 100 изображений). Более того, большинство из этих методов не сравнивали эффективность предлагаемых ими методов с другими базовыми показателями или с работой врачей.


Константино и др. [8] сравнили производительность семи полуавтоматических и двух методов сегментации глубокого обучения, а Weisman et al. [9] сравнили 11 методов автоматической сегментации, хотя оба эти исследования были выполнены на меньших наборах данных размером 65 и 90 соответственно. Вейсман и др. [10] сравнили результаты сегментации автоматизированного метода 3D Deep Medic с результатами врача, хотя даже это исследование включало всего 90 случаев лимфомы. За исключением [10], ни в одном из этих исследований не сообщалось об обобщении модели на наборе данных, находящихся за пределами распределения (например, на данных, собранных из разных центров), что ограничивало их количественную оценку надежности и внешнюю валидность. Цзян и др. [11] использовали относительно больший набор данных по сравнению с вышеупомянутыми исследованиями с 297 изображениями для обучения 3D UNet. Они даже провели внераспределенное тестирование на 117 изображениях, собранных из другого центра. Насколько нам известно, самый большой набор данных ПЭТ/КТ лимфомы для сегментации поражений на основе глубокого обучения, когда-либо сообщавшийся, представляет собой работу Blanc-Durand et al. [12] использовали 639 изображений для разработки модели и 94 для внешнего тестирования; однако в этом исследовании использовались только стандартные показатели оценки сегментации и оценивалась способность их модели прогнозировать точное TMTV. Оба исследования [11] и [12] ограничены тем фактом, что их наборы данных состояли исключительно из пациентов с диагнозом диффузная крупноклеточная В-клеточная лимфома (DLBCL), представляющая только один подтип лимфомы.


В большинстве существующих исследований сегментации лимфом на основе глубокого обучения сообщается о результатах их работы по общим показателям сегментации, таким как коэффициент сходства Дайса (DSC), пересечение-объединение (IoU), чувствительность и т. д. При наличии крупных сегментированных поражений очень небольшие пропущенные поражения или небольшие ложноположительные результаты не вносят большого вклада в значение DSC. Следовательно, необходимо сообщать об объемах ложноположительных и ложноотрицательных результатов. Также будет полезно оценить эффективность обнаружения для каждого поражения (количество обнаруженных подключенных компонентов по сравнению с пропущенными), поскольку автоматическое обнаружение даже нескольких вокселов всех поражений может помочь врачам быстро определить области интереса, даже если ДСК низкий. Более того, сложность задачи сегментации/обнаружения часто не оценивается посредством анализа соглашения между или внутри наблюдателя.



Наше исследование направлено на устранение этих ограничений. Мы обучили и проверили четыре глубокие нейронные сети на наборах данных ПЭТ/КТ лимфомы из трех групп, охватывающих два различных подтипа лимфомы: DLBCL и первичную медиастинальную крупноклеточную B-клеточную лимфому (PMBCL). (i) Мы провели как тестирование (изображения, полученные из тех же когорт, что и набор обучения/проверки), так и внераспределенное или внешнее (изображения из четвертой когорты, не использованные для обучения/проверки) тестирование, чтобы оценить надежность наших моделей. (ii) Мы сообщили о производительности с использованием DSC, объемов ложноположительных и отрицательных результатов и оценили зависимость производительности от шести различных типов показателей поражения. (iii) Мы также оценили способность наших сетей воспроизводить эти основные показатели ущерба и вычислили ошибки сетей при их прогнозировании. (iv) Мы предложили три типа критериев обнаружения для нашего варианта использования и оценили эффективность модели по этим показателям. (v) Наконец, мы оценили согласие внутри и между наблюдателями, чтобы оценить сложность задачи сегментации поражений в наших наборах данных.


Этот документ доступен на arxiv под лицензией CC 4.0.