MRI del cerebro desempeña un papel vital en el diagnóstico de condiciones de salud graves en los bebés, desde los tumores a las enfermedades neurodegenerativas. Detectar el desarrollo anormal del cerebro durante la infancia puede guiar las intervenciones tempranas que pueden prevenir o reducir el impacto de las condiciones como la parálisis cerebral. Sin embargo, la exploración de tales pacientes jóvenes lleva riesgos, ya que el procedimiento requiere anestesia general. Es por eso que los médicos necesitan herramientas que aceleren el diagnóstico, reduzcan los riesgos y tomen decisiones oportunas e informadas. Investigadores de la Universidad Estatal de Pediatría de San Petersburgo se han asociado con la Escuela de Análisis de Datos de Yandex (SDA) y el Centro de Nube de Tecnologías y Sociedad de Yandex para desarrollar una solución de IA para evaluar el desarrollo del cerebro de los bebés a partir de escáneres MRI. Mi nombre es Yulia Busygina, y soy la líder del proyecto en Yandex Cloud. Junto con el profesor Alexander Pozdnyakov, te llevaré detrás de los escenarios y compartiré cómo diseñamos la solución de IA, entrenamos el modelo y lo probamos para ver cómo funciona en escenarios del mundo real. . GitHub ¿Por qué los escáneres MRI son críticos para los bebés? El cerebro de un bebé se desarrolla a un ritmo increíble, cambiando casi semana tras semana durante el primer año de vida.Pero no se trata sólo de crecer, el cerebro también está pasando por procesos críticos conocidos colectivamente como desarrollo cerebral. La mielinación es la formación de una capa rica en lípidos alrededor de las fibras nerviosas, que aumenta el contenido de lípidos y reduce el agua.Este proceso comienza en el quinto mes del desarrollo fetal y continúa a pleno ritmo hasta alrededor de la edad de dos años.En el sistema nervioso central, la mielina se encuentra principalmente en la materia blanca, donde actúa como un aislador eléctrico. La mielinación saludable permite una comunicación rápida y confiable entre las neuronas en los últimos años. Si el cerebro se desarrolla más lentamente de lo esperado, puede conducir a retrasos en el desarrollo. El cerebro humano es un sistema complejo que requiere atención cuidadosa desde los primeros días de vida. Los trastornos pueden surgir si el crecimiento cerebral es demasiado lento o demasiado rápido. Además, la complejidad va más allá de la tasa de crecimiento. En algunas condiciones, el volumen del cerebro permanece inalterado mientras su densidad de tejido cambia. Ya sea que la mielinación sea anormalmente lenta o excesivamente rápida (hipermielinación), puede crear condiciones que conducen a trastornos neurológicos. — Alexander Pozdnyakov, MD, profesor y jefe del Departamento de Biofísica Médica, Universidad Médica Pediátrica Estatal de San Petersburgo. Es la formación de una capa rica en lípidos alrededor de las fibras nerviosas, que aumenta el contenido de lípidos y reduce el agua.Este proceso comienza en el quinto mes del desarrollo fetal y continúa a pleno ritmo hasta alrededor de la edad de dos años.En el sistema nervioso central, la mielina se encuentra principalmente en la materia blanca, donde actúa como un aislador eléctrico. Myelination La mielinación saludable permite una comunicación rápida y confiable entre las neuronas en los últimos años.Si el cerebro se desarrolla más lentamente de lo esperado, puede conducir a retrasos en el desarrollo.El cerebro humano es un sistema complejo que requiere atención cuidadosa desde los primeros días de vida.Los trastornos pueden surgir si el crecimiento cerebral es demasiado lento o demasiado rápido. Además, la complejidad va más allá de la tasa de crecimiento. En algunas condiciones, el volumen del cerebro permanece inalterado mientras su densidad de tejido cambia. Ya sea que la mielinación sea anormalmente lenta o excesivamente rápida (hipermielinación), puede crear condiciones que conducen a trastornos neurológicos. — Alexander Pozdnyakov, MD, profesor y jefe del Departamento de Biofísica Médica, Universidad Médica Pediátrica Estatal de San Petersburgo. Los bebés con mielinación anormalmente lenta tienen un mayor riesgo de desarrollar parálisis cerebral. La parálisis cerebral es una de las principales causas de discapacidad infantil que afecta a 2-3 de cada 1.000 recién nacidos. El monitoreo de la maduración cerebral en los primeros seis meses de vida puede ser crucial para la intervención oportuna. Para los pacientes en riesgo, actuar rápidamente con las terapias y la rehabilitación adecuadas puede prevenir el daño y detener la muerte celular. Algunos pacientes presentan condiciones que son mal comprendidas y difíciles de clasificar, pero incluso en estos casos, podemos anticipar los riesgos e intervenir de forma segura en el desarrollo del cerebro. Dichas intervenciones pueden incluir medicamentos o técnicas de estimulación cerebral para acelerar la maduración cuando sea necesario, o ralentizarlo a niveles normales cuando es anormalmente rápido. — Alexander Pozdnyakov, MD, profesor y jefe del Departamento de Biofísica Médica, Universidad Médica Pediátrica Estatal de San Petersburgo. Algunos pacientes presentan condiciones que son mal comprendidas y difíciles de clasificar, pero incluso en estos casos, podemos anticipar los riesgos e intervenir de forma segura en el desarrollo del cerebro. Dichas intervenciones pueden incluir medicamentos o técnicas de estimulación cerebral para acelerar la maduración cuando sea necesario, o ralentizarlo a niveles normales cuando es anormalmente rápido. — Alexander Pozdnyakov, MD, profesor y jefe del Departamento de Biofísica Médica, Universidad Médica Pediátrica Estatal de San Petersburgo. En la MRI, la materia blanca mielinizada se destaca claramente de las áreas donde la mielinación es incompleta. En pacientes menores de 12 meses, sin embargo, a menudo es difícil distinguir la materia blanca de la materia gris. Esto es importante porque la materia gris forma el córtex cerebral, el núcleo del cerebro para los procesos cognitivos. Cuando los radiólogos analizan escáneres MRI durante esta etapa del desarrollo cerebral, se enfrentan a dos desafíos principales: Differentiating between white matter and gray matter. Determining the volume of gray matter and white matter. A través del análisis de los radiólogos, los clínicos pueden estudiar cómo las células nerviosas se mueven a través de la materia blanca hacia el córtex, creando las vías neuronales del cerebro. Para los bebés, un IRM es ordenado por el médico asistente sólo cuando hay indicaciones clínicas graves. Estos pueden incluir lesiones del sistema nervioso relacionadas con el nacimiento, trauma cerebral, convulsiones o sospecha de epilepsia. Debido a que los pacientes menores de seis años de edad requieren anestesia general para permanecer en silencio durante el procedimiento, las IRM se realizan en niños pequeños sólo cuando realmente es necesario. Así es como suele ser el procedimiento: The medical team places the patient under general anesthesia, positions them in the MRI scanner, and captures the images. The procedure typically takes about 30 minutes but can last up to 40–50 minutes. These images are then processed. A specialist can calculate the volumes of white matter and gray matter using a three-axis formula. Clinical guidelines define the timeframe for this analysis, which can take up to 72 hours in complex cases. Si se trata de una búsqueda de seguimiento, el análisis toma aún más tiempo porque los datos deben ser evaluados en comparación con los resultados anteriores de diferentes puntos de tiempo. Cómo puede ayudar Los métodos existentes para evaluar la mielinación cerebral en niños menores de un año a menudo involucran factores subjetivos. Los radiólogos experimentados generalmente pueden determinar a partir de las imágenes si el volumen de materia blanca es suficiente. La tarea se vuelve mucho más desafiante cuando los radiólogos necesitan comparar varios estudios a lo largo del tiempo. Incluso un único IRM del cerebro implica la revisión de varias imágenes (al menos 22 flechas). La visión por ordenador puede ayudar a los radiólogos al marcar áreas donde los cambios en los contornos de la materia blanca y la materia gris son más probables. Esto también podría servir como una ayuda de formación inestimable para médicos y residentes menores. Speed up the analysis process. Optimize follow-up schedules to ensure scans are performed only as often as needed, avoiding unnecessary anesthesia. Enhance radiologists’ capacity to examine more patients. A primera vista, puede parecer que podríamos simplemente reutilizar los conjuntos de datos de código abierto disponibles y modelos pre-entrenados para este propósito. Después de todo, problemas similares ya se han abordado utilizando AI en competiciones de aprendizaje automático. Por ejemplo, el Gran Desafío MICCAI de 2019 se centró en segmentar imágenes MRI de cerebros de bebés menores de seis meses. Después de todo, problemas similares ya se han abordado utilizando AI en competiciones de aprendizaje automático. Por ejemplo, el Gran Desafío MICCAI de 2019 se centró en segmentar imágenes MRI de cerebros de bebés menores de seis meses. MICCAI Gran Desafío Sin embargo, el conjunto de datos existente carecía de las anotaciones necesarias, las máscaras de segmentación que identifican qué áreas de una imagen corresponden a la materia gris o a la materia blanca.El conjunto de datos iSeg-2019 incluyó solo 15 imágenes anotadas, mientras que el archivo de seis años de la universidad contenía escaneos MRI de 1500 pacientes sin anotaciones en absoluto. Esto significó que nuestro primer paso fue preparar los datos. Cómo convertir las escenas MRI en un conjunto de datos para el aprendizaje automático El equipo de Yandex Cloud creó una arquitectura de aplicaciones basada en la nube, ayudó a seleccionar las herramientas adecuadas y ayudó a configurar y probar el servicio web final.Guiado por el mentor Arseniy Zemerov, los estudiantes de la Escuela de Análisis de Datos de Yandex se encargaron de las tareas clave de ML: elegir la arquitectura de la red neural, ejecutar experimentos y entrenar el modelo sobre los datos anotados. Aquí hay una visión general de alto nivel de la tubería de datos. Veamos la primera etapa. Los escáneres MRI se almacenan en un sistema de archivo de imagen y comunicación (PACS) diseñado para gestionar imágenes médicas en formato DICOM. Este sistema archiva y procesa escáneres anónimos, que forman el núcleo del conjunto de datos de formación del modelo. Para desplegar este sistema, configuramos una máquina virtual en Yandex Compute Cloud. Hemos cargado estudios de MRI anónimos de niños menores de 12 meses del archivo de la universidad, junto con los datos de iSeg-2019. Loading the raw data Cada estudio es una colección de imágenes de RMN capturadas en diferentes modos: T1, T2, FLAIR y DWI. Estos modos destacan diferentes características del tejido, ayudando a los clínicos a diferenciar mejor entre diferentes condiciones (para más detalles, véase Para cumplir con estos requisitos, este sistema almacena metadatos adicionales y trata múltiples fatias de RMN como un estudio único y unificado. Esto asegura que no se almacenan datos personales en el servidor porque sólo trabajamos con un conjunto de datos anónimo. Este artículo Este artículo Para los pacientes mayores de un año, las imágenes radiológicas del cerebro pueden ser anotadas utilizando herramientas automatizadas como el cortador 3D de código abierto, que calcula los volúmenes de materia blanca y materia gris. Sin embargo, estos métodos no son eficaces para los pacientes más jóvenes. En las escenas de IRM de los recién nacidos, incluso los radiólogos experimentados pueden encontrarlo difícil de distinguir la materia blanca de la materia gris, haciendo la anotación una meticulosa tarea de píxel por píxel. Annotating the collected data Inicialmente, planeamos que los radiólogos expertos anotaran los datos crudos desde cero, pero el proceso resultó demasiado demorado: un único estudio con solo unos cuantos tiros podría tardar ocho horas o más. Para acelerar el proceso, nuestros especialistas en ML propusieron realizar pre-anotación utilizando un modelo de código abierto llamado Red de segmentación basada en la intensidad del bebé ( La red se basa en el marco nnU-Net y está diseñado para identificar la materia blanca y la materia gris. BIBNET BIBNET Después de revisar los resultados de pre-anotación, encontramos que todavía había mucho espacio para mejorar muchas de las métricas. El tiempo de inferencia para un solo volumen fue de unos 2,5 minutos. The BIBSNet Docker container was adapted for parallel execution. The container was deployed on 20 virtual machines, each processing data independently. Esto reduce el tiempo de pre-anotación para todo el conjunto de datos, lo que permite evaluar el rendimiento del algoritmo en él. Según nuestros expertos radiólogos, las pre-anotaciones fueron útiles en el 40% de los casos, y eso solo ayudó a reducir la carga de trabajo manual. Nuestros especialistas en ML también compararon el rendimiento de BIBSNet en la segmentación de materia gris (GM) y materia blanca (WM) en T1-pesado (sagittal) y T2-pesado (axial) escáneres de MRI. Como resultado, la pre-anotación nos ayudó a construir un conjunto de datos anotado de alrededor de 750 piezas. Esto fue suficiente para entrenar y evaluar modelos de aprendizaje automático para la segmentación y detección. Antes de ejecutar los experimentos, dividimos el conjunto de datos en conjuntos de capacitación y validación, utilizando este último para comprobar nuestras métricas. Dentro de nuestros experimentos de formación de modelos Inicialmente, planeamos probar una arquitectura más avanzada, el Vision Transformer. Sin embargo, pronto nos dimos cuenta de que esta arquitectura era adecuada para fines de atención médica. Así que elegimos un segmentador construido a partir de dos tipos de redes neuronales: Las redes neuronales convolucionales sirven como extractores de características (bacterias), adaptándose bien a tareas más allá de la clasificación (como la segmentación). Arquitecturas explícitamente desarrolladas para la imagen médica, con la U-Net como la elección primaria. El equipo de la Escuela de Análisis de Datos de Yandex tuvo como objetivo desarrollar un modelo de segmentación que podría ser tan preciso como BIBSNet pero ofrecer un tiempo de inferencia mucho más rápido. Para lograr esto, los estudiantes realizaron una serie de experimentos en el conjunto de datos iSeg-2019. Para las arquitecturas de redes neuronales, examinaron U-Net, U-Net++ y DeepLabV3. Para los vertebrados de extracción de características, probaron ResNet-50, ResNet-101, ResNeXt-50, ResNeXt-101, y DenseNet-161. Durante los experimentos, el equipo probó varios enfoques: Training purely on target slices (2D): We trained a 2D segmentation model exclusively on manually annotated slices (the initial 30 studies). However, the small amount of training data limited the model's capacity to generalize. Training on combined iSeg-2019 and target data (3D): The model was trained on a combined dataset that included the fully annotated iSeg-2019 data and our target data. For slices in the target studies without annotations, we applied a mask that zeroed out their contribution to the loss function. This ensured that only annotated slices from the target data were used, preventing errors during training. Lo que descubrimos Aquí está lo que nuestros experimentos con diferentes espinas de extracción de características mostraron: Experimentos con la arquitectura de la red: El experimento de mejor rendimiento fue entrenar una U-Net con una columna vertebral ResNeXt50 usando la función DiceLoss. Aquí está cómo funciona el modelo en el conjunto de validación.Estudio original del conjunto de validación: Ejemplo de salida del algoritmo Las métricas finales: iou void iou GM iou WM iou mean unet_resnext50_32x4d_dice_1 0.981 0.629 0.501 0.703 unet_resnext50_32x4d_dice_1 0.981 0.629 0.501 0.703 La velocidad de inferencia de la red neural entrenada que se ejecuta en una CPU es de aproximadamente 3 segundos. Cómo funciona actualmente Nuestra solución , , fue diseñado como un servicio web para los radiólogos que realizan escaneos MRI en bebés. Pueden cargar los archivos adquiridos al servicio justo después del procedimiento. El sistema anonimiza los datos cargados, eliminando toda la información de identificación personal, como el nombre del paciente, de los registros. Disponible en GitHub La solución identifica automáticamente las áreas de materia gris y materia blanca en cada fila de RMN, proporcionando predicciones con puntuaciones de confianza. El servicio es principalmente morfométrico, lo que significa que mide los volúmenes de tejido.Una vez que el procesamiento se completa, los usuarios ven los volúmenes predecibles del modelo de materia gris, materia blanca y líquido cerebrospinal, junto con descripciones de las estructuras más grandes. Desde la tabla de resumen, puede seleccionar un estudio específico para ver la exploración con las máscaras de materia blanca y materia gris aplicadas. Nuestros experimentos muestran una precisión de más del 90%. esperamos que esta cifra mejore a medida que ampliamos el conjunto de datos y continuamos ajustando el modelo, que fue entrenado inicialmente en datos limitados. Mirando hacia adelante, el mapa de ruta del proyecto va más allá de la segmentación básica.Nuestro siguiente paso es calcular la relación GM-WM, que puede proporcionar a los clínicos una visión más profunda. La red neural ha sido probada en la Universidad Estatal de Medicina Pediátrica de San Petersburgo, y los investigadores están listos para compartir sus hallazgos con otras instituciones médicas. Una vez que los ensayos se hayan completado, planeamos lanzar la solución como código abierto para su uso en instituciones médicas y proyectos de investigación en todo el mundo. La solución también tiene un potencial científico significativo. Debido a que los volúmenes cerebrales de los bebés no se habían medido previamente en escala, ningún estudio fundamental ha examinado aún los cambios en el volumen cerebral en cohortes grandes. Para diversas condiciones y patologías, esta investigación puede ayudar a refinar los estándares de atención médica.