paint-brush
Big Data en Pharma: qué es y cómo se utilizapor@itrex
723 lecturas
723 lecturas

Big Data en Pharma: qué es y cómo se utiliza

por ITRex13m2023/06/23
Read on Terminal Reader

Demasiado Largo; Para Leer

Analizamos el potencial de los macrodatos en la industria farmacéutica y exploramos formas esenciales en las que la tecnología de macrodatos cambia la forma en que se desarrollan los medicamentos.
featured image - Big Data en Pharma: qué es y cómo se utiliza
ITRex HackerNoon profile picture
0-item

Resumen del artículo:

  • El sector farmacéutico tiene acceso a una gran cantidad de datos: registros de salud electrónicos, información genómica, evidencia del mundo real y más. Todos estos datos combinados pueden denominarse big data. Aprovechar los patrones ocultos en los big data puede generar un valor inmenso para el sector.

  • Al recurrir a los grandes datos, el sector farmacéutico puede impulsar mejoras en cada paso del proceso de desarrollo de fármacos, desde el descubrimiento de fármacos y la identificación de nuevos objetivos a través de ensayos clínicos y aprobación regulatoria hasta la comercialización y el seguimiento posterior al lanzamiento.

  • La adopción de big data en la industria farmacéutica es una empresa desafiante que requerirá que las empresas superen los silos organizacionales, integren sin problemas fuentes de datos dispares y garanticen el cumplimiento normativo.


Hace tres años, el sector farmacéutico se enfrentó a un desafío sin precedentes. Ahora, las lecciones aprendidas en la crisis están impulsando el cambio en toda la industria.


La conmoción comenzó poco tiempo después de que el nuevo coronavirus avanzara rápidamente en todo el mundo. Las compañías farmacéuticas atrajeron la atención mundial al esforzarse por desarrollar nuevas vacunas para COVID-19 mientras continuaban con el suministro de productos médicos vitales a los pacientes que los necesitaban.


El sector aguantó la crisis notablemente bien. Sin embargo, lo que se vio es que las compañías farmacéuticas ya no pueden permitirse una gestión reactiva de crisis. Deberían surgir nuevos paradigmas que puedan ayudar a la industria a combatir problemas pendientes desde hace mucho tiempo , a saber:


  • El costo de desarrollar un nuevo fármaco alcanza los $2.284 millones en 2022
  • Los tiempos de ciclo promedio aumentan a 7,09 años en 2022
  • La rentabilidad de las inversiones en I+D farmacéutica cae hasta el 1,2 %.


Los actores de la industria pueden cerrar asociaciones científicas, invertir en mercados emergentes y diversificar sus carteras de productos para combatir esos problemas. Sin embargo, los entusiastas de la tecnología con una década de experiencia brindando servicios de consultoría de big data y soluciones de software farmacéutico , sugerimos considerar otra forma: una basada en datos.


En esta publicación de blog, analizamos el potencial de los macrodatos en la industria farmacéutica y exploramos formas esenciales en las que la tecnología de macrodatos cambia la forma en que se desarrollan, aprueban y comercializan los medicamentos.

¿Qué son los grandes datos en la industria farmacéutica y cómo se traducen en valor?

El sector farmacéutico genera inmensas cantidades de información. Datos de ensayos clínicos, registros de salud electrónicos, información genómica, evidencia del mundo real y resultados informados por pacientes: todas estas entradas de datos combinadas pueden denominarse big data.


Esencialmente, los grandes datos son información voluminosa y diversa de cualquier formato y de cualquier fuente que se puede convertir en información a través de análisis.


Así es como se ve el proceso estándar de traducir big data en grandes conocimientos:

Todo comienza con la recopilación de datos relevantes. Los tipos y fuentes pueden variar mucho. Los tipos comunes de información que componen big data en la industria farmacéutica abarcan:


  • Datos de ensayos clínicos que abarcan la información recopilada durante la evaluación de medicamentos. Puede incluir protocolos de estudio, datos demográficos de los participantes, historial médico, respuestas al tratamiento, eventos adversos, resultados de pruebas de laboratorio y más.
  • Evidencia del mundo real que incluye datos recopilados fuera de entornos de ensayos clínicos controlados en la práctica clínica real. Podría abarcar reclamos, datos de dispositivos portátiles y registros de salud electrónicos, así como resultados informados por los pacientes.
  • Datos genómicos y moleculares que involucran información genética individual, incluidas variaciones de ADN, perfiles de expresión génica y biomarcadores genómicos, así como información sobre la estructura, interacciones y funciones de moléculas relevantes para el descubrimiento de fármacos.
  • Registros de salud electrónicos que incluyen el historial médico del paciente, alergias, diagnósticos, resultados de laboratorio y otra información relevante.
  • Datos de imágenes que abarcan radiografías, resonancias magnéticas y tomografías computarizadas.
  • Informes de farmacovigilancia y eventos adversos que arrojan luz sobre los eventos adversos y las preocupaciones de seguridad asociadas con los medicamentos.
  • Literatura científica que abarca trabajos de investigación, actas de congresos y patentes.
  • “Datos ómicos” que se refiere a conjuntos de datos a gran escala generados a partir de las denominadas disciplinas “ómicas”, como la genómica, la metabolómica, la proteómica, la transcriptómica y otras.


Antes de cargarse en un almacén de datos (piense: almacenamiento centralizado para todos los grandes datos farmacéuticos), la información recuperada de múltiples fuentes se somete a limpieza y transformación. Este es un paso importante que garantiza que los datos sean claros, correctos y convertidos a un formato unificado. Los datos limpios y arreglados luego se almacenan en el almacén de datos, donde son fácilmente accesibles para análisis.

Los casos de uso esenciales de big data en la industria farmacéutica

El desarrollo de fármacos es un camino largo y arriesgado. Muy pocos candidatos a fármacos llegan al mercado. De los 5000 compuestos que ingresan a las pruebas preclínicas, solo cinco, en promedio, llegan a las pruebas en humanos . Y solo uno de los 5000 iniciales se aprueba para uso clínico.

La buena noticia es que en cada paso del proceso de desarrollo de fármacos, los macrodatos farmacéuticos pueden resultar útiles.

Descubrimiento de medicamento

La etapa fundamental en la I+D farmacéutica, el descubrimiento de fármacos, comienza cuando los investigadores comprenden el proceso detrás de una enfermedad a nivel celular o molecular. Con los objetivos potenciales identificados, el proceso sigue buscando compuestos que puedan interactuar con el objetivo e interferir con su actividad.


Los desafíos clave que enfrentan los investigadores en esta etapa incluyen identificar objetivos efectivos y seguros, así como encontrar compuestos que tengan la potencia, selectividad y perfiles de seguridad deseados.


Al recurrir a los grandes datos farmacéuticos, los investigadores pueden resolver estos problemas y mejorar la velocidad y la eficacia del descubrimiento de fármacos.

Identificación y validación de objetivos

Los conjuntos de datos de diversas fuentes se pueden integrar utilizando big data. Mediante el análisis de estos conjuntos de datos multidimensionales, los investigadores pueden identificar nuevos objetivos , indicaciones de fármacos y biomarcadores de respuesta a fármacos de forma más rápida y con menos riesgos.


Recientemente se han creado y hecho públicos muchos conjuntos de macrodatos farmacéuticos de referencia para el descubrimiento preclínico de fármacos:


  • dbSNP : polimorfismos de un solo nucleótido (SNP) para una amplia gama de organismos, incluidos más de 150 millones de SNP de referencia humanos.
  • dbVar : variaciones estructurales genómicas generadas principalmente por estudios publicados de varios organismos, incluidos más de 2,1 millones de CNV humanos.
  • COSMIC : principalmente mutaciones somáticas de la selección de expertos y la detección de todo el genoma, incluidas más de 3,5 millones de mutaciones codificantes.
  • Proyecto 1000 Genomas : Genomas de un gran número de personas que proporcionan un recurso integral sobre la variación genética humana; este conjunto de datos abarca más de 2500 muestras.
  • TCGA : Repositorio de datos de genómica y genómica funcional para más de 30 tipos de cáncer en 10 000 muestras. Los tipos de datos primarios incluyen mutación, número de copias, ARNm y expresión de proteínas.
  • GEO : repositorio de datos de genómica funcional alojado por NCBI, que incluye más de 1,6 millones de muestras.
  • ArrayExpress : repositorio de datos de genómica funcional alojado por EBI, que incluye más de 1,8 millones de muestras.
  • GTEx : perfiles transcriptómicos de tejidos normales, incluidas más de 7000 muestras en 45 tipos de tejido.
  • CCLE : Caracterización genética y farmacológica de más de 1.000 líneas celulares de cáncer.


Estos grandes conjuntos de datos farmacéuticos se están utilizando ampliamente para identificar moléculas objetivo.

Por ejemplo, en el descubrimiento de fármacos, la expresión génica es una de las características moleculares más utilizadas para informar la selección de objetivos.


Un grupo de investigadores recurrió a uno de los grandes conjuntos de datos farmacéuticos disponibles públicamente para examinar la expresión de ARNm de las 844 muestras de cáncer de mama presentadas y compararlas con tejidos mamarios normales. Como resultado del análisis de los grandes datos incluidos en el conjunto de datos, descubrieron que el gen MTBP estaba significativamente elevado en las muestras cancerosas. La referencia cruzada de los hallazgos con los datos de supervivencia también reveló que el aumento de MTBP está relacionado significativamente con una supervivencia deficiente del paciente.


En el ejemplo anterior, el objetivo fue propuesto por los investigadores. Con big data en la industria farmacéutica, los objetivos también se pueden descubrir directamente mediante el análisis de big data público. De esta manera, un grupo de investigadores buscó quinasas farmacológicas que sean oncogénicas en el cáncer de mama sin objetivos específicos en mente. Analizaron datos de expresión génica de grandes conjuntos de datos farmacéuticos públicos y perfiles de expresión génica de células iniciadoras de tumores de mama para encontrar 13 quinasas con mayor expresión de ARNm en líneas celulares de cáncer. La validación posterior redujo la lista de candidatos a ocho quinasas, tres de las cuales fueron elegidas como dianas terapéuticas.

Modelado predictivo

Tradicionalmente, los investigadores usaban compuestos de plantas o animales para probar fármacos candidatos. En septiembre de 2022, el Senado de los EE. UU. aprobó la Ley de Modernización 2.0 de la FDA, que permitió el uso de alternativas a las pruebas con animales, incluidos los modelos informáticos.


El enfoque basado en modelos informáticos permite eludir las inexactitudes y los problemas éticos asociados con las pruebas con animales. También tiene el potencial de acercar al sector a una representación real de la actividad biológica humana.


Una de las técnicas de modelado predictivo utilizadas en la industria farmacéutica es el modelado farmacocinético. Piense: usar macrodatos farmacéuticos, ecuaciones matemáticas y simulaciones por computadora para comprender cómo se “comportan” las drogas en el cuerpo humano. El método ayuda a predecir lo que sucede con un medicamento una vez que se toma, incluida la forma en que se absorbe, distribuye, metaboliza y elimina.


Otra técnica prometedora que se basa en grandes datos en la industria farmacéutica es la tecnología de órgano en chip. Los órganos en chips son chips de polímero que utilizan estructuras celulares microfluídicas para imitar la funcionalidad de los órganos humanos y el entorno fisiológico para el modelado de enfermedades in vitro, las pruebas de fármacos y la medicina de precisión. En ITRex hemos ayudado a crear una plataforma de órgano en un chip que demostró su eficacia para abordar los problemas asociados con las pruebas con animales. Adoptada por más de 100 laboratorios, la plataforma ayudó a acelerar el desarrollo de fármacos y a reducir los costos asociados.

Medicina de precisión

La medicina de precisión se puede definir como un enfoque que tiene como objetivo proporcionar el tratamiento adecuado a la persona adecuada en el momento adecuado. Tradicionalmente, las estrategias de precisión seguían siendo en su mayoría aspiracionales para la mayoría de los problemas clínicos. Hoy en día, el uso cada vez mayor de big data en la industria farmacéutica promete alcanzar ese objetivo al que se aspira.


Menos dependiente del conocimiento previo, el desarrollo de fármacos basado en big data tiene el potencial de revelar caminos inesperados relevantes para una enfermedad, allanando el camino hacia un mayor grado de precisión y personalización. Algunas instituciones ya están aprovechando el enfoque novedoso .


Por ejemplo, los pacientes con un subtipo de cáncer similar a menudo responden de manera diferente cuando reciben la misma quimioterapia. Se cree que las respuestas a los fármacos están influenciadas por la inestabilidad genómica. El uso de big data se está convirtiendo en una forma popular de estudiar la compleja relación entre la genómica y la resistencia, toxicidad y sensibilidad a la quimioterapia.


Por ejemplo, los científicos pueden descubrir nuevas aberraciones del cáncer a través del proyecto Pan-Cancer, lanzado por la red de investigación Cancer Genome Atlas. Varios otros proyectos, como Cancer Cell Line Encyclopedia y Genomics of Drug Sensitivity in Cancer, también están generando grandes datos farmacéuticos que investigan los vínculos entre los biomarcadores genómicos y la sensibilidad a los medicamentos.

Ensayos clínicos

El objetivo de un ensayo clínico es determinar si un tratamiento es seguro y eficaz para los seres humanos.

Por lo general, sigue en tres etapas secuenciales, desde la fase I, en la que se prueba un fármaco en un pequeño grupo de personas sanas, hasta la fase II, en la que se prueba el fármaco en un grupo más grande de personas que muestran una afección específica a la que se dirigen, todos el camino a la fase III que involucra a un mayor número de pacientes.


El proceso siempre ha sido largo y tedioso. Afortunadamente, con la adopción más amplia de big data en la industria farmacéutica, los ensayos clínicos también están cambiando.

Reclutamiento más rápido

Nueve de cada diez ensayos en todo el mundo no pueden reclutar suficientes personas dentro de los plazos previstos. Algunos ensayos, especialmente aquellos que prueban tratamientos para enfermedades raras o potencialmente mortales, luchan por reclutar suficientes personas en total. Por lo general, los ensayos clínicos involucran dos grupos: un grupo de prueba que recibe un nuevo tratamiento que se está probando y un grupo de control que no recibe ningún tratamiento, un placebo o el tratamiento estándar actual.


Teniendo en cuenta que los pacientes con condiciones que amenazan la vida necesitan ayuda rápida, no quieren ser asignados al azar a un grupo de control. Agregue la necesidad de reclutar pacientes con condiciones relativamente raras, y el tiempo de reclutamiento se extiende por meses.


Big data puede ayudar a evitar la necesidad de contratar un grupo de control por completo. La idea es utilizar “grupos de control virtuales” creados a partir de grandes datos farmacéuticos generados en ensayos anteriores.

Para encontrar posibles candidatos para el grupo de control, los investigadores utilizan los criterios de elegibilidad clave de un ensayo de investigación, por ejemplo, las características clave de la enfermedad y qué tan avanzada está. Un ensayo clínico estándar selecciona a los pacientes de control de manera similar. La diferencia es que, en lugar de depender de los datos recopilados durante el ensayo actual, se utilizan datos anteriores. Sin embargo, por ahora, un grupo de control virtual no reemplaza a un ensayo clínico tradicional, sino una forma rápida de evaluar si vale la pena seguir un nuevo tratamiento.


Otro aspecto de los grandes datos en los ensayos clínicos farmacéuticos es permitir el reclutamiento dirigido. Con tecnologías novedosas, los investigadores pueden inscribir pacientes en función de nuevas fuentes de datos, por ejemplo, las redes sociales. Se vuelve más fácil sopesar criterios como la información genética, el estado de la enfermedad y las características individuales.

Gestión eficiente de ensayos

El uso de big data en la industria farmacéutica puede cambiar la forma en que se diseñan y gestionan los ensayos clínicos. Ahora los investigadores pueden rastrear y detectar los niveles de exposición al fármaco, la inmunidad proporcionada por el medicamento, la tolerabilidad y seguridad del tratamiento y otros factores que son cruciales para la seguridad de los reclutas en tiempo real, no solo después de que finalicen los ensayos.


Los avances que logran los investigadores recurriendo al big data farmacéutico abarcan:


  • Cálculo del tamaño de la muestra óptimo : el análisis de los datos históricos de los ensayos puede ayudar a informar los cálculos del tamaño de la muestra.
  • Estratificación y análisis de subgrupos : los grandes datos pueden ayudar a identificar las características de los pacientes, los biomarcadores o los factores genéticos que influyen en las respuestas al tratamiento. Esto puede ayudar a los investigadores a estratificar a los pacientes en subgrupos para analizar los efectos del tratamiento dentro de poblaciones específicas.
  • Diseño de ensayo adaptativo : el análisis de big data farmacéutico puede facilitar el diseño de ensayo adaptativo y permitir que los investigadores cambien los parámetros del ensayo en función de los resultados intermedios. Los investigadores ahora pueden profundizar en las tendencias, las respuestas al tratamiento o las señales de seguridad para tomar decisiones informadas sobre la modificación de los parámetros del ensayo, como el tamaño de las muestras o los criterios de inscripción.

Control de calidad y cumplimiento

Los macrodatos en la industria farmacéutica están revolucionando los enfoques tradicionales del control de calidad farmacéutico, lo que permite a las empresas farmacéuticas implementar mejores procesos de control de calidad, agilizar los esfuerzos de cumplimiento y ofrecer medicamentos más seguros y efectivos. Las áreas en las que los macrodatos farmacéuticos pueden generar un impacto significativo incluyen:

Farmacovigilancia mejorada y seguimiento de efectos adversos

Muchos efectos adversos, especialmente los raros, pasan desapercibidos debido a un número limitado de individuos muestreados en ensayos clínicos. Por eso es necesario monitorear las drogas incluso después de su liberación.

Teniendo en cuenta que las redes sociales se han convertido en la plataforma para expresar las preocupaciones de los clientes y reportar los efectos secundarios, las compañías farmacéuticas comenzaron a aprovechar las herramientas de big data para aprovechar esta información invaluable.


Las reacciones adversas a los medicamentos informadas por los pacientes obtenidas de las redes sociales pueden incluso resultar más precisas que las registradas por los profesionales médicos. Un estudio realizado por la FDA y Epidemico examinó 6,9 millones de tuits y encontró que 4401 de ellos se asemejan a un informe de eventos adversos. La comparación adicional de los hallazgos con los datos en poder de la FDA reveló una alta relación entre los informes informales de las redes sociales y los documentados en los ensayos clínicos.

Gestión de cumplimiento mejorada

Big data en la industria farmacéutica juega un papel importante para facilitar el cumplimiento normativo. Las empresas de la industria farmacéutica están sujetas a una compleja red de regulaciones, que incluyen GMP (buenas prácticas de fabricación) y GCP (buenas prácticas clínicas), así como estrictas leyes de privacidad de datos. Big data en productos farmacéuticos puede ayudar a las empresas a monitorear indicadores clave de desempeño, identificar brechas de cumplimiento y abordar problemas potenciales de manera proactiva.


Las empresas farmacéuticas pueden minimizar los riesgos regulatorios al detectar anomalías , desviaciones y actividades no conformes desde el principio mediante el uso de sistemas de monitoreo automatizados y soluciones de análisis de big data . Además, al combinar datos históricos, algoritmos de aprendizaje automático y técnicas estadísticas avanzadas, las empresas farmacéuticas pueden desarrollar modelos predictivos que anticipen posibles riesgos de calidad, optimicen los programas de mantenimiento preventivo y faciliten la toma de decisiones basada en datos.

Ventas y marketing

Mediante el uso de big data farmacéutico, las empresas pueden predecir las tendencias de la industria y anticipar las ventas de medicamentos específicos en función de factores demográficos. Esto puede ayudar a adaptar las campañas de marketing farmacéutico al comportamiento del cliente.


De manera similar al caso de uso descrito anteriormente, el análisis de los datos disponibles en Internet, incluidos los datos de las redes sociales, podría ayudar a las empresas farmacéuticas a medir el sentimiento de los clientes en torno a sus productos. Esto puede ayudar a las compañías farmacéuticas a comprender cómo se reciben sus productos.

Los desafíos de adoptar big data en la industria farmacéutica

A pesar de los beneficios que los grandes datos están generando en la industria farmacéutica, las empresas siguen siendo conscientes de la necesidad de revisar sus procesos de gestión de datos. Hemos elaborado una lista de desafíos que las empresas pueden enfrentar al adoptar big data en la industria farmacéutica para que su proceso de implementación sea menos riesgoso.

Desafío 1. Integrar fuentes de datos

Tener todas las fuentes de datos bien vinculadas es uno de los desafíos clave que debe superar el sector farmacéutico para cosechar los beneficios de los grandes datos. El uso efectivo de big data en el sector farmacéutico requiere la integración de datos generados en todas las etapas del proceso de desarrollo de fármacos, desde el descubrimiento hasta la aprobación regulatoria y la aplicación en el mundo real.


La integración de datos de extremo a extremo requiere muchas capacidades: desde recopilar datos confiables, conectar estas fuentes, llevar a cabo un control de calidad sólido, administrar flujos de trabajo y más.

En general, recomendamos evitar revisar todas las infraestructuras de datos a la vez debido a los riesgos y costos involucrados. Un enfoque más seguro es integrar sus fuentes de datos paso a paso, identificando los tipos de datos específicos que deben manejarse primero y creando capacidades de almacenamiento adicionales según sea necesario. El objetivo es abordar primero los datos críticos para obtener el ROI lo antes posible. Paralelamente, puede desarrollar escenarios para integrar fuentes de datos de menor prioridad.

Desafío 2. Superar los silos organizacionales

La integración de datos de extremo a extremo apenas es posible sin superar los silos dentro de una organización. Tradicionalmente en la industria farmacéutica, diferentes equipos tenían la responsabilidad de sus sistemas y datos. Cambiar a un enfoque centrado en los datos con un propietario claro para cada tipo de datos a través de silos funcionales y a través de la canalización de datos facilitará la capacidad de generar valor a partir de big data en la industria farmacéutica.

Reto 3. Cumplimiento normativo

Al adoptar big data en la industria farmacéutica y desplegar sistemas centralizados de administración de datos, debe asegurarse de que los datos se manejen de manera segura. La FDA exige que el software utilizado en el sector (por ejemplo, los sistemas utilizados para manejar registros de salud electrónicos o administrar ensayos clínicos) cumpla con una serie de requisitos, incluidos los procedimientos de control de acceso, la verificación de la identidad del usuario, el seguimiento de las acciones realizadas y más. Al planificar su proyecto, asegúrese de estudiar detenidamente los requisitos de cumplimiento pertinentes e incorporarlos en el diseño de su solución de gestión de datos.

Desafío 4. Falta de talento para manejar big data

Tradicionalmente, el sector farmacéutico ha adoptado lentamente la tecnología, por lo que muchas empresas aún carecen del talento necesario para realizar sus ambiciosos planes. Los actores de la industria farmacéutica deben pensar en una forma adecuada de cerrar la brecha de conocimiento, ya sea creando talento interno o recurriendo a equipos externos.

En lugar de una conclusión

Big data en la industria farmacéutica presenta grandes oportunidades para la innovación, la eficiencia y mejores resultados para los pacientes. A medida que el mercado de big data farmacéutico sigue creciendo, las empresas están adoptando esta tecnología transformadora para seguir siendo competitivas.


Si busca desbloquear el verdadero poder de Big Data e impulsar avances en el desarrollo de fármacos, comuníquese con nuestros expertos y responderemos cualquier pregunta que quede sin respuesta.


También publicado aquí .