МРТ головного мозга играет жизненно важную роль в диагностике серьезных состояний здоровья у младенцев, от опухолей до нейродегенеративных заболеваний. Обнаружение аномального развития мозга во время младенчества может направлять ранние вмешательства, которые могут предотвратить или уменьшить влияние состояний, таких как церебральный паралич. Тем не менее, сканирование таких молодых пациентов несет риски, так как процедура требует общей анестезии. Исследователи Санкт-Петербургского государственного педиатрического медицинского университета совместно с Яндекс Школой анализа данных (Яндекс) и Яндекс облачным центром технологий и общества разработали ИИ-решение для оценки развития мозга младенцев с помощью МРТ. Для подозреваемых случаев церебрального паралича и других нарушений центральной нервной системы решение выступает в качестве инструмента поддержки принятия решений, сокращая время анализа МРТ с нескольких дней до нескольких минут. Меня зовут Юлия Бусигина, и я являюсь руководителем проекта в Yandex Cloud. Вместе с профессором Александром Поздниковым я возьму вас за кулисы — и поделимся тем, как мы разработали решение ИИ, обучили модель и протестировали ее, чтобы увидеть, как она работает в реальных сценариях. . ГИТБУБ Почему МРТ-сканирование важно для детей Мозг младенца развивается с невероятной скоростью, изменяясь почти из недели в неделю в течение первого года жизни.Но это не только о том, чтобы стать больше - мозг также проходит через критические процессы, известные коллективно как развитие мозга. Миелинизация – это образование богатой липидами оболочки вокруг нервных волокон, которая увеличивает содержание липидов и уменьшает воду.Этот процесс начинается в пятый месяц развития плода и продолжается в полном темпе до двухлетнего возраста.В центральной нервной системе миелин встречается в основном в белом веществе, где он действует как электрический изолятор. Здоровая миелинизация позволяет быстрому, надежному общению между нейронами в последние годы. Если мозг развивается медленнее, чем ожидалось, это может привести к задержке развития. Тх человеческий мозг является сложной системой, которая требует тщательного внимания с самых первых дней жизни. Расстройства могут возникнуть, если рост мозга слишком медленный или слишком быстрый.Кроме того, сложность выходит за рамки темпов роста. В некоторых условиях объем мозга остается неизменным, в то время как его плотность тканей меняется. Будь миелинизация аномально медленная или чрезмерно быстрая (гипермиелинизация), она может создать условия, которые приводят к неврологическим расстройствам. — Александр Поздняков, доктор медицинских наук, профессор и руководитель кафедры медицинской биофизики Санкт-Петербургского государственного педиатрического медицинского университета. Миелинизация – это образование богатой липидами оболочки вокруг нервных волокон, которая увеличивает содержание липидов и уменьшает воду.Этот процесс начинается в пятый месяц развития плода и продолжается в полном темпе до двухлетнего возраста.В центральной нервной системе миелин встречается в основном в белом веществе, где он действует как электрический изолятор. Здоровая миелинизация позволяет быстро и надежно общаться между нейронами в последние годы.Если мозг развивается медленнее, чем ожидалось, это может привести к задержке развития.Человеческий мозг - это сложная система, которая требует тщательного внимания с самых первых дней жизни. Более того, сложность выходит за рамки темпов роста.В некоторых условиях объем мозга остается неизменным, в то время как его плотность тканей меняется.Независимо от того, является ли миелинизация аномально медленной или чрезмерно быстрой (гипермиелинизация), она может создать состояния, которые приводят к неврологическим расстройствам. — Александр Поздняков, доктор медицинских наук, профессор и руководитель кафедры медицинской биофизики Санкт-Петербургского государственного педиатрического медицинского университета. Младенцы с аномально медленной миелинизацией имеют более высокий риск развития церебрального паралича. Церебральный паралич является одной из ведущих причин детской нетрудоспособности, которая затрагивает 2-3 из каждых 1000 новорожденных. Мониторинг созревания мозга в первые шесть месяцев жизни может быть решающим для своевременного вмешательства. Для пациентов, находящихся в группе риска, быстрое действие с правильной терапией и реабилитацией может предотвратить повреждение и остановить гибель клеток. Некоторые пациенты присутствуют с состояниями, которые плохо понимаются и трудно классифицировать, но даже в этих случаях мы можем предсказать риски и безопасно вмешиваться в развитие мозга. Такие вмешательства могут включать медикаменты или методы стимуляции мозга, чтобы ускорить созревание, когда это необходимо, или замедлить его до нормальных уровней, когда это аномально быстро. — Александр Поздняков, доктор медицинских наук, профессор и руководитель кафедры медицинской биофизики Санкт-Петербургского государственного педиатрического медицинского университета. Некоторые пациенты присутствуют с состояниями, которые плохо понимаются и трудно классифицировать, но даже в этих случаях мы можем предсказать риски и безопасно вмешиваться в развитие мозга. Такие вмешательства могут включать медикаменты или методы стимуляции мозга, чтобы ускорить созревание, когда это необходимо, или замедлить его до нормальных уровней, когда это аномально быстро. — Александр Поздняков, доктор медицинских наук, профессор и руководитель кафедры медицинской биофизики Санкт-Петербургского государственного педиатрического медицинского университета. На МРТ-сканировании миелинизованная белая материя четко выделяется из областей, где миелинизация является неполной. У пациентов младше 12 месяцев, однако, отличить белую материю от серой материи часто трудно. Когда рентгенологи анализируют МРТ-сканирование на этой стадии развития мозга, они сталкиваются с двумя основными проблемами: Differentiating between white matter and gray matter. Determining the volume of gray matter and white matter. Благодаря анализу рентгенологов, клиницисты могут изучить, как нервные клетки перемещаются через белую материю в сторону коры, создавая нейронные пути мозга. Для младенцев МРТ назначается лечащим врачом только при наличии серьезных клинических показаний. К ним могут относиться травмы нервной системы, связанные с рождением, травмы головного мозга, судороги или подозрения на эпилепсию. Поскольку пациенты в возрасте до шести лет нуждаются в общей анестезии, чтобы оставаться неподвижным во время процедуры, МРТ выполняются на маленьких детях только тогда, когда это действительно необходимо. Вот как обычно проходит процедура: The medical team places the patient under general anesthesia, positions them in the MRI scanner, and captures the images. The procedure typically takes about 30 minutes but can last up to 40–50 minutes. These images are then processed. A specialist can calculate the volumes of white matter and gray matter using a three-axis formula. Clinical guidelines define the timeframe for this analysis, which can take up to 72 hours in complex cases. Если речь идет о последующем сканировании, анализ занимает еще больше времени, потому что данные должны быть оценены по сравнению с предыдущими результатами из разных точек времени. Как AI может помочь Существующие методы оценки миелинизации головного мозга у детей в возрасте до одного года часто включают субъективные факторы. Опытные рентгенологи обычно могут определить по изображениям, достаточно ли объема белого вещества. Задача становится намного сложнее, когда рентгенологам приходится сопоставлять несколько исследований с течением времени.Даже один МРТ головного мозга включает в себя обзор нескольких изображений (по крайней мере 22 разреза).В сложных случаях может потребоваться анализ более тысячи изображений, что делает невозможным быстрый обзор всего. Компьютерное зрение может помочь рентгенологам, обозначив области, где изменения контуров белого и серого вещества наиболее вероятны.Это также может служить бесценной учебной помощью для младших врачей и жителей.Это решение обеспечивает несколько преимуществ для раннего сканирования: Speed up the analysis process. Optimize follow-up schedules to ensure scans are performed only as often as needed, avoiding unnecessary anesthesia. Enhance radiologists’ capacity to examine more patients. На первый взгляд, может показаться, что мы можем просто повторно использовать доступные наборы данных с открытым исходным кодом и предварительно подготовленные модели для этой цели. В конце концов, подобные проблемы уже были решены с использованием ИИ в соревнованиях по машинному обучению. Например, 2019 MICCAI Grand Challenge сосредоточился на сегментировании МРТ изображений мозга младенцев в возрасте до шести месяцев. В конце концов, подобные проблемы уже были решены с использованием ИИ в конкурсах машинного обучения. Разработчики со всего мира попытались решить проблему с использованием набора данных iSeg-2019. MICCAI Grand Challenge Миккай Grand Challenge Однако в существующем наборе данных не хватало необходимых аннотаций — масок сегментации, которые идентифицируют, какие области изображения соответствуют серому или белому материалу. в наборе данных iSeg-2019 содержалось только 15 аннотированных изображений, в то время как шестилетний архив университета содержал МРТ от 1500 пациентов без аннотаций вообще. Это означало, что наш первый шаг заключался в подготовке данных. Как превратить МРТ-сканирование в набор данных для машинного обучения Команда Yandex Cloud придумала облачную архитектуру приложений, помогла подобрать нужные инструменты, а также помогла с настройкой и тестированием окончательного веб-сервиса.Под руководством наставника Арсения Земерова студенты из Школы анализа данных Яндекса справились с основными задачами ML: выбор архитектуры нейронной сети, проведение экспериментов и обучение модели по аннотированным данным.Самая сложная задача — аннотация данных — была настоящим коллективным усилием, с экспертными рентгенологами из Санкт-Петербургского государственного педиатрического медицинского университета, предоставляющими критическую экспертизу. Вот обзор на высоком уровне трубопровода данных. Давайте посмотрим на первый этап. МРТ-сканы хранятся в системе архивирования изображений и связи (PACS), предназначенной для управления медицинскими изображениями в формате DICOM. Эта система архивирует и обрабатывает анонимные сканы, которые образуют ядро набора данных обучения модели. Чтобы развернуть эту систему, мы установили виртуальную машину в Яндекс Compute Cloud. Мы загрузили анонимные исследования МРТ детей до 12 месяцев из архива университета вместе с данными iSeg-2019. Loading the raw data Каждое исследование представляет собой сборник МРТ-изображений, захваченных в разных режимах: T1, T2, FLAIR и DWI. Эти режимы подчеркивают различные характеристики тканей, помогая клиницистам лучше дифференцировать различные состояния (подробнее см. Для удовлетворения этих требований эта система хранит дополнительные метаданные и обрабатывает несколько резьб МРТ как одно, единое исследование. Эта статья Эта статья Для пациентов старше года рентгенологические изображения мозга могут быть аннотированы с помощью автоматизированных инструментов, таких как 3D Slicer с открытым исходным кодом, который вычисляет объемы белого вещества и серого вещества. Однако эти методы не эффективны для более молодых пациентов. Annotating the collected data Первоначально мы планировали, чтобы эксперты-радиологи отмечали сырые данные с нуля, но процесс оказался слишком трудоемким: одно исследование с несколькими резьбами может занять восемь часов или больше. Чтобы ускорить процесс, наши специалисты по ML предложили выполнить предварительную аннотацию с использованием модели с открытым исходным кодом под названием Baby Intensity-Based Segmentation Network ( Сеть основана на структуре nnU-Net и предназначена для идентификации белого и серого вещества. Бибнет Бибнет После пересмотра результатов предварительной аннотации мы обнаружили, что еще есть много места для улучшения многих показателей. Время вывода для одного тома составляло около 2,5 минут. The BIBSNet Docker container was adapted for parallel execution. The container was deployed on 20 virtual machines, each processing data independently. Это сокращает время предварительной аннотации для всего набора данных, что позволяет оценить производительность алгоритма на нем.По данным наших экспертов-радиологов, предварительная аннотация была полезна в 40% случаев, и только это помогло уменьшить ручную нагрузку.Наши специалисты ML также сравнили производительность BIBSNet в сегментировании серой материи (ГМ) и белой материи (WM) на T1-весовых (сагиттальных) и T2-весовых (аксиальных) МРТ. В результате предварительная аннотация помогла нам построить аннотированный набор данных, состоящий примерно из 750 фрагментов. Этого было достаточно для обучения и оценки моделей машинного обучения для сегментации и обнаружения. Перед запуском экспериментов мы разделили набор данных на наборы обучения и валидации, используя последние для проверки наших показателей. Внутри нашей модели тренировочных экспериментов Первоначально мы планировали попробовать более продвинутую архитектуру, Vision Transformer. Однако вскоре мы поняли, что эта архитектура хорошо подходит для медицинских целей. Таким образом, мы выбрали сегментатор, построенный из двух типов нейронных сетей: Конволюционные нейронные сети служат экстракторами функций (задницы), хорошо адаптируясь к задачам, выходящим за рамки классификации (например, сегментации). Архитектуры, разработанные специально для медицинских изображений, с U-Net в качестве основного выбора. Команда Yandex School of Data Analysis стремилась разработать модель сегментации, которая может быть такой же точной, как BIBSNet, но обеспечивать гораздо более быстрое время вывода. Для достижения этого студенты провели серию экспериментов на наборе данных iSeg-2019. Для архитектур нейронных сетей они изучили U-Net, U-Net++ и DeepLabV3. Для костей для извлечения функций они протестировали ResNet-50, ResNet-101, ResNeXt-50, ResNeXt-101 и DenseNet-161. Во время экспериментов команда пробовала несколько подходов: Training purely on target slices (2D): We trained a 2D segmentation model exclusively on manually annotated slices (the initial 30 studies). However, the small amount of training data limited the model's capacity to generalize. Training on combined iSeg-2019 and target data (3D): The model was trained on a combined dataset that included the fully annotated iSeg-2019 data and our target data. For slices in the target studies without annotations, we applied a mask that zeroed out their contribution to the loss function. This ensured that only annotated slices from the target data were used, preventing errors during training. Что мы обнаружили Вот что показали наши эксперименты с различными хребтами для извлечения функций: Эксперименты с сетевой архитектурой: Наиболее эффективным экспериментом было обучение U-Net с помощью позвоночника ResNeXt50 с использованием функции DiceLoss. Вот как работает модель на наборе валидаций.Оригинальное исследование из набора валидаций: Пример выхода из алгоритма Окончательные метрики : iou void iou GM iou WM iou mean unet_resnext50_32x4d_dice_1 0.981 0.629 0.501 0.703 unet_resnext50_32x4d_dice_1 0.981 0.629 0.501 0.703 Скорость вывода обученной нейронной сети, работающей на процессоре, составляет около 3 секунд. Как он работает в настоящее время Наше решение , , был разработан как веб-сервис для рентгенологов, выполняющих МРТ-сканирование на младенцах. Они могут загружать приобретенные файлы в службу сразу после процедуры. Система анонимизирует загруженные данные, удаляя из записей всю лично идентифицируемую информацию, такую как имя пациента. Теперь доступно на GitHub Решение автоматически идентифицирует зоны серого вещества и белого вещества на каждом участке МРТ, обеспечивая прогнозы с достоверными баллами. Сервис в основном является морфометрическим, что означает, что он измеряет объемы тканей.Когда обработка завершена, пользователи видят предсказанные объемы серой материи, белой материи и спинномозговой жидкости модели, а также описания крупнейших структур. Из обобщающей таблицы вы можете выбрать конкретное исследование, чтобы просмотреть сканирование с применением масок белого и серого вещества. Наши эксперименты показывают точность более 90%.Мы ожидаем, что эта цифра улучшится по мере расширения набора данных и продолжения тонкости модели, которая первоначально была обучена на ограниченных данных. Оглядываясь вперед, дорожная карта проекта выходит за рамки базовой сегментации.Наш следующий шаг заключается в расчете соотношения ГМ к ВМ, которое может предоставить клиницистам более глубокие представления. Нейронная сеть была протестирована в Санкт-Петербургском государственном педиатрическом медицинском университете, и исследователи готовы поделиться своими результатами с другими медицинскими учреждениями. Как только тестирование будет завершено, мы планируем выпустить решение в качестве открытого исходного кода для использования в медицинских учреждениях и научно-исследовательских проектах по всему миру. Решение также имеет значительный научный потенциал. Поскольку объемы мозга младенцев ранее не измерялись в масштабах, никаких фундаментальных исследований пока не исследовали изменения объема мозга в больших когортах. Для различных состояний и патологий это исследование может помочь усовершенствовать стандарты медицинской помощи.