paint-brush
Le Big Data dans l'industrie pharmaceutique : de quoi s'agit-il et comment est-il utilisé ?par@itrex
723 lectures
723 lectures

Le Big Data dans l'industrie pharmaceutique : de quoi s'agit-il et comment est-il utilisé ?

par ITRex13m2023/06/23
Read on Terminal Reader

Trop long; Pour lire

Nous examinons le potentiel des mégadonnées dans le secteur pharmaceutique et explorons les moyens essentiels par lesquels la technologie des mégadonnées modifie la façon dont les médicaments sont développés.
featured image - Le Big Data dans l'industrie pharmaceutique : de quoi s'agit-il et comment est-il utilisé ?
ITRex HackerNoon profile picture
0-item

Résumé de l'article:

  • Le secteur pharmaceutique a accès à de nombreuses données : dossiers de santé électroniques, informations génomiques, preuves du monde réel, etc. Toutes ces données combinées peuvent être qualifiées de mégadonnées. Exploiter les modèles cachés dans les mégadonnées peut générer une immense valeur pour le secteur.

  • En se tournant vers les mégadonnées, le secteur pharmaceutique peut apporter des améliorations à chaque étape du processus de développement de médicaments, depuis la découverte de médicaments et l'identification de nouvelles cibles via les essais cliniques et l'approbation réglementaire jusqu'à la commercialisation et la surveillance post-lancement.

  • L'adoption du Big Data dans le secteur pharmaceutique est une entreprise difficile qui obligera les entreprises à surmonter les silos organisationnels, à intégrer de manière transparente des sources de données disparates et à assurer la conformité réglementaire.


Il y a trois ans, le secteur pharmaceutique était confronté à un défi sans précédent. Aujourd'hui, les leçons tirées de la crise alimentent des changements à l'échelle de l'industrie.


L'agitation a commencé peu de temps après que le nouveau coronavirus ait fait des progrès rapides dans le monde. Les sociétés pharmaceutiques ont attiré l'attention mondiale en s'efforçant de développer de nouveaux vaccins contre le COVID-19 tout en continuant à fournir des produits médicaux vitaux aux patients dans le besoin.


Le secteur a remarquablement bien résisté à la crise. Ce qui est apparu cependant, c'est que les sociétés pharmaceutiques ne peuvent plus se permettre une gestion de crise réactive. De nouveaux paradigmes devraient émerger pour aider l'industrie à lutter contre les problèmes qui se posent depuis longtemps , à savoir :


  • Le coût de développement d'un nouveau médicament atteint 2 284 millions de dollars en 2022
  • Augmentation des temps de cycle moyens à 7,09 ans en 2022
  • Le retour sur investissement en R&D pharmaceutique chute à 1,2%.


Les acteurs de l'industrie peuvent nouer des partenariats scientifiques, investir dans les marchés émergents et diversifier leurs portefeuilles de produits pour lutter contre ces problèmes. Cependant, les passionnés de technologie avec une décennie d'expérience dans la fourniture de services de conseil en Big Data et de solutions logicielles pharmaceutiques , nous suggérons d'envisager une autre voie, celle basée sur les données.


Dans cet article de blog, nous examinons le potentiel des mégadonnées dans le secteur pharmaceutique et explorons les moyens essentiels par lesquels la technologie des mégadonnées modifie la façon dont les médicaments sont développés, approuvés et commercialisés.

Qu'est-ce que le big data dans l'industrie pharmaceutique et comment se traduit-il en valeur ?

Le secteur pharmaceutique génère d'immenses quantités d'informations. Données d'essais cliniques, dossiers de santé électroniques, informations génomiques, preuves du monde réel et résultats rapportés par les patients - toutes ces entrées de données combinées peuvent être qualifiées de mégadonnées.


Essentiellement, les mégadonnées sont des informations volumineuses et diverses de n'importe quel format et de n'importe quelle source qui peuvent être converties en informations via l'analyse.


Voici à quoi ressemble le processus standard de traduction de Big Data en Big Insights :

Tout commence par la collecte de données pertinentes. Les types et les sources de celui-ci peuvent varier beaucoup. Les types d'informations courants qui composent le Big Data dans l'industrie pharmaceutique :


  • Données d'essais cliniques qui englobent les informations recueillies lors de l'évaluation des médicaments. Il peut inclure les protocoles d'étude, les données démographiques des participants, les antécédents médicaux, les réponses au traitement, les événements indésirables, les résultats des tests de laboratoire, etc.
  • Preuves du monde réel qui incluent des données collectées en dehors des paramètres d'essais cliniques contrôlés dans la pratique clinique réelle. Cela pourrait couvrir les réclamations, les données des appareils portables et des dossiers de santé électroniques, ainsi que les résultats signalés par les patients.
  • Données génomiques et moléculaires qui impliquent des informations génétiques individuelles, y compris les variations d'ADN, les profils d'expression génique et les biomarqueurs génomiques, ainsi que des informations sur la structure, les interactions et les fonctions des molécules pertinentes pour la découverte de médicaments.
  • Dossiers de santé électroniques qui incluent les antécédents médicaux, les allergies, les diagnostics, les résultats de laboratoire et d'autres informations pertinentes d'un patient.
  • Données d'imagerie couvrant les rayons X, les IRM et les tomodensitogrammes.
  • Rapports de pharmacovigilance et d'événements indésirables qui font la lumière sur les événements indésirables et les problèmes de sécurité associés aux médicaments.
  • Littérature scientifique qui couvre les articles de recherche, les actes de conférence et les brevets.
  • Les « données omiques » qui font référence à des ensembles de données à grande échelle générés à partir de disciplines dites « omiques », telles que la génomique, la métabolomique, la protéomique, la transcriptomique et autres.


Avant d'être chargées dans un entrepôt de données (pensez : stockage centralisé pour toutes les mégadonnées pharmaceutiques), les informations extraites de plusieurs sources subissent un nettoyage et une transformation. Il s'agit d'une étape importante qui garantit que les données sont claires, correctes et converties en format unifié. Les données nettoyées et soignées sont ensuite stockées dans l'entrepôt de données, où elles sont facilement accessibles pour l'analyse.

Les cas d'utilisation incontournables du big data dans l'industrie pharmaceutique

Le développement de médicaments est une route longue et risquée. Très peu de candidats-médicaments arrivent sur le marché. Sur 5 000 composés qui entrent dans les tests précliniques, seuls cinq, en moyenne, parviennent aux tests sur l'homme . Et un seul des 5 000 premiers est approuvé pour une utilisation clinique.

La bonne nouvelle est qu'à chaque étape du processus de développement de médicaments, les mégadonnées pharmaceutiques peuvent être utiles.

Découverte de médicament

Étape fondamentale de la R&D pharmaceutique, la découverte de médicaments commence par la compréhension par les chercheurs du processus à l'origine d'une maladie au niveau cellulaire ou moléculaire. Une fois les cibles potentielles identifiées, le processus suit en recherchant des composés qui peuvent interagir avec la cible et interférer avec son activité.


Les principaux défis auxquels les chercheurs sont confrontés à ce stade comprennent l'identification de cibles efficaces et sûres, ainsi que la recherche de composés qui ont les profils de puissance, de sélectivité et d'innocuité souhaités.


En se tournant vers les mégadonnées pharmaceutiques, les chercheurs peuvent résoudre ces problèmes et améliorer la rapidité et l'efficacité de la découverte de médicaments.

Identification et validation des cibles

Des ensembles de données provenant de diverses sources peuvent être intégrés à l'aide de mégadonnées. En analysant ces ensembles de données multidimensionnelles, les chercheurs peuvent identifier de nouvelles cibles , des indications de médicaments et des biomarqueurs de réponse aux médicaments plus rapidement et avec moins de risques.


De nombreux grands ensembles de données pharmaceutiques de référence pour la découverte préclinique de médicaments ont récemment été créés et rendus publics :


  • dbSNP : polymorphismes mononucléotidiques (SNP) pour un large éventail d'organismes, dont plus de 150 millions de SNP humains de référence.
  • dbVar : Variations structurelles génomiques générées principalement par des études publiées sur divers organismes, dont plus de 2,1 millions de CNV humains.
  • COSMIC : principalement des mutations somatiques issues de la curation experte et du dépistage à l'échelle du génome, dont plus de 3,5 millions de mutations codantes.
  • 1000 Genomes Project : Génomes d'un grand nombre de personnes qui fournissent une ressource complète sur la variation génétique humaine ; cet ensemble de données couvre plus de 2 500 échantillons.
  • TCGA : référentiel de données de génomique et de génomique fonctionnelle pour plus de 30 cancers sur 10 000 échantillons. Les principaux types de données incluent la mutation, le nombre de copies, l'ARNm et l'expression des protéines.
  • GEO : Dépôt de données de génomique fonctionnelle hébergé par le NCBI, comprenant plus de 1,6 million d'échantillons.
  • ArrayExpress : référentiel de données de génomique fonctionnelle hébergé par EBI, comprenant plus de 1,8 million d'échantillons.
  • GTEx : Profils transcriptomiques de tissus normaux, comprenant plus de 7 000 échantillons dans 45 types de tissus.
  • CCLE : Caractérisation génétique et pharmacologique de plus de 1 000 lignées cellulaires cancéreuses.


Ces grands ensembles de données pharmaceutiques sont largement utilisés pour identifier les molécules cibles.

Par exemple, dans la découverte de médicaments, l'expression génique est l'une des caractéristiques moléculaires les plus largement utilisées pour éclairer la sélection des cibles.


Un groupe de chercheurs s'est tourné vers l'un des grands ensembles de données pharmaceutiques accessibles au public pour examiner l'expression de l'ARNm des 844 échantillons de cancer du sein présentés et les comparer aux tissus mammaires normaux. À la suite de l'analyse des mégadonnées incluses dans l'ensemble de données, ils ont découvert que le gène MTBP était significativement élevé dans les échantillons cancéreux. Le recoupement des résultats avec les données de survie a également révélé que l'augmentation de la MTBP est significativement liée à une faible survie des patients.


Dans l'exemple ci-dessus, la cible a été proposée par les chercheurs. Avec les mégadonnées dans l'industrie pharmaceutique, les cibles peuvent également être directement découvertes en analysant les mégadonnées publiques. De cette façon, un groupe de chercheurs a recherché des kinases médicamenteuses qui sont oncogènes dans le cancer du sein sans cible spécifique à l'esprit. Ils ont analysé les données d'expression génique des grands ensembles de données pharmaceutiques publiques et les profils d'expression génique des cellules initiatrices de tumeurs mammaires pour trouver 13 kinases avec une expression d'ARNm plus élevée dans les lignées cellulaires cancéreuses. La validation ultérieure a réduit la liste des candidats à huit kinases, dont trois ont été choisies comme cibles thérapeutiques.

Modélisation prédictive

Traditionnellement, les chercheurs utilisaient des composés végétaux ou animaux pour tester des médicaments candidats. En septembre 2022, le Sénat américain a adopté le FDA Modernization Act 2.0, qui autorise l'utilisation d'alternatives aux tests sur les animaux, y compris des modèles informatiques.


L'approche basée sur des modèles informatiques permet de contourner les imprécisions et les problèmes éthiques liés à l'expérimentation animale. Il a également le potentiel de rapprocher le secteur d'une représentation réelle de l'activité biologique humaine.


L'une des techniques de modélisation prédictive utilisées dans l'industrie pharmaceutique est la modélisation pharmacocinétique. Réfléchissez : utilisez des mégadonnées pharmaceutiques, des équations mathématiques et des simulations informatiques pour comprendre comment les médicaments « se comportent » dans le corps humain. La méthode aide à prédire ce qui arrive à un médicament une fois pris, y compris comment il est absorbé, distribué, métabolisé et éliminé.


Une autre technique prometteuse qui s'appuie sur les mégadonnées dans l'industrie pharmaceutique est la technologie des organes sur puce. Les organes sur puces sont des puces polymères qui utilisent des structures cellulaires microfluidiques pour imiter la fonctionnalité des organes humains et l'environnement physiologique pour la modélisation in vitro des maladies, les tests de médicaments et la médecine de précision. Chez ITRex, nous avons aidé à créer une plate-forme d'organes sur puce qui a montré son efficacité pour résoudre les problèmes associés aux tests sur les animaux. Adoptée par plus de 100 laboratoires, la plateforme a permis d'accélérer le développement de médicaments et de réduire les coûts qui y sont associés.

Médecine de précision

La médecine de précision peut être définie comme une approche visant à apporter le bon traitement à la bonne personne au bon moment. Traditionnellement, les stratégies de précision restaient principalement ambitieuses pour la plupart des problèmes cliniques. Aujourd'hui, l'utilisation croissante des mégadonnées dans l'industrie pharmaceutique promet d'atteindre cet objectif ambitieux.


Moins dépendant des connaissances antérieures, le développement de médicaments basé sur les mégadonnées a le potentiel de révéler des voies inattendues pertinentes pour une maladie, ouvrant la voie à un degré plus élevé de précision et de personnalisation. Certaines institutions tirent déjà parti de la nouvelle approche .


Par exemple, les patients atteints d'un sous-type de cancer similaire réagissent souvent différemment lorsqu'ils reçoivent les mêmes agents chimiothérapeutiques. On pense que les réponses aux médicaments sont influencées par l'instabilité génomique. L'utilisation de mégadonnées devient un moyen populaire d'étudier la relation complexe entre la génomique et la résistance, la toxicité et la sensibilité à la chimiothérapie.


Par exemple, les scientifiques peuvent découvrir de nouvelles aberrations cancéreuses grâce au projet Pan-Cancer, lancé par le réseau de recherche Cancer Genome Atlas. Plusieurs autres projets, tels que l'encyclopédie des lignées cellulaires cancéreuses et la génomique de la sensibilité aux médicaments dans le cancer, génèrent également des mégadonnées pharmaceutiques qui étudient les liens entre les biomarqueurs génomiques et la sensibilité aux médicaments.

Essais cliniques

Le but d'un essai clinique est de dire si un traitement est sûr et efficace pour l'homme.

Habituellement, il se déroule en trois étapes séquentielles, à partir de la phase I, au cours de laquelle un médicament est testé sur un petit groupe d'individus en bonne santé, jusqu'à la phase II, où le médicament est testé sur un plus grand groupe de personnes présentant une condition spécifique ciblée, toutes la voie vers la phase III qui implique un plus grand nombre de patients.


Le processus a toujours été long et fastidieux. Heureusement, avec l'adoption plus large des mégadonnées dans le secteur pharmaceutique, les essais cliniques évoluent également.

Recrutement plus rapide

Neuf essais sur dix dans le monde ne parviennent pas à recruter suffisamment de personnes dans les délais impartis. Certains essais, en particulier ceux testant des traitements pour des maladies rares ou potentiellement mortelles, ont du mal à recruter suffisamment de personnes. En règle générale, les essais cliniques impliquent deux groupes : un groupe test qui reçoit un nouveau traitement en cours de test et un groupe témoin qui ne reçoit aucun traitement, un placebo ou le traitement standard actuel.


Gardant à l'esprit que les patients atteints d'affections potentiellement mortelles ont besoin d'une aide rapide, ils ne veulent pas être randomisés dans un groupe témoin. Ajoutez à cela la nécessité de recruter des patients atteints de maladies relativement rares, et le temps de recrutement s'étend sur des mois.


Le Big Data peut aider à contourner complètement le besoin d'embaucher un groupe de contrôle. L'idée est d'utiliser des «groupes de contrôle virtuels» créés sur la base de mégadonnées pharmaceutiques générées lors d'essais antérieurs.

Pour trouver d'éventuels candidats au groupe témoin, les chercheurs utilisent les principaux critères d'éligibilité d'un essai expérimental, par exemple, les principales caractéristiques de la maladie et son état d'avancement. Un essai clinique standard sélectionne les patients témoins de la même manière. La différence est qu'au lieu de s'appuyer sur les données recueillies au cours de l'essai en cours, les données antérieures sont utilisées. Pour l'instant, cependant, un groupe de contrôle virtuel ne remplace pas un essai clinique traditionnel, mais plutôt un moyen rapide d'évaluer si un nouveau traitement vaut la peine d'être poursuivi.


Un autre aspect du big data dans les essais cliniques pharmaceutiques est de permettre un recrutement ciblé. Grâce aux nouvelles technologies, les chercheurs peuvent recruter des patients sur la base de nouvelles sources de données, par exemple les médias sociaux. Il devient plus facile de peser des critères tels que l'information génétique, l'état de la maladie et les caractéristiques individuelles.

Gestion efficace des essais

L'utilisation des mégadonnées dans l'industrie pharmaceutique peut changer la façon dont les essais cliniques sont conçus et gérés. Désormais, les chercheurs peuvent suivre et détecter les niveaux d'exposition aux médicaments, l'immunité fournie par le médicament, la tolérabilité et la sécurité du traitement, ainsi que d'autres facteurs cruciaux pour la sécurité des recrues en temps réel, et pas seulement après la fin des essais.


Les gains que les chercheurs obtiennent en se tournant vers les mégadonnées pharmaceutiques couvrent :


  • Calcul optimal de la taille de l'échantillon : l'analyse des données d'essai historiques peut aider à éclairer les calculs de la taille de l'échantillon.
  • Stratification et analyse de sous-groupes : les mégadonnées peuvent aider à identifier les caractéristiques des patients, les biomarqueurs ou les facteurs génétiques qui influencent les réponses au traitement. Cela peut aider les chercheurs à stratifier les patients en sous-groupes pour analyser les effets du traitement au sein de populations spécifiques.
  • Conception d'essai adaptative : l'analyse des mégadonnées pharmaceutiques peut faciliter la conception d'essai adaptative et permettre aux chercheurs de modifier les paramètres de l'essai en fonction des résultats intermédiaires. Les chercheurs peuvent désormais approfondir les tendances, les réponses au traitement ou les signaux de sécurité afin de prendre des décisions éclairées sur la modification des paramètres de l'essai, tels que la taille des échantillons ou les critères d'inscription.

Contrôle qualité et conformité

Le Big Data dans le secteur pharmaceutique révolutionne les approches traditionnelles du contrôle de la qualité pharmaceutique, permettant aux sociétés pharmaceutiques de mettre en œuvre de meilleurs processus de contrôle de la qualité, de rationaliser les efforts de conformité et de fournir des médicaments plus sûrs et plus efficaces. Les domaines dans lesquels les mégadonnées pharmaceutiques peuvent avoir un impact significatif comprennent :

Amélioration de la pharmacovigilance et de la surveillance des effets indésirables

De nombreux effets indésirables, en particulier les plus rares, ne sont pas détectés en raison du nombre limité d'individus échantillonnés dans les essais cliniques. C'est pourquoi il est nécessaire de surveiller les médicaments même après leur libération.

Considérant que les médias sociaux sont devenus la plate-forme pour exprimer les préoccupations des clients et signaler les effets secondaires, les sociétés pharmaceutiques ont commencé à tirer parti des outils de mégadonnées pour exploiter ces informations inestimables.


Les effets indésirables signalés par les patients et recueillis sur les réseaux sociaux peuvent même s'avérer plus précis que ceux enregistrés par les professionnels de la santé. Une étude menée par la FDA et Epidemico a examiné 6,9 millions de tweets et a découvert que 4 401 d'entre eux ressemblaient à un rapport d'événement indésirable. Une comparaison plus poussée des résultats avec les données détenues par la FDA a révélé une forte relation entre les rapports informels des médias sociaux et ceux documentés dans les essais cliniques.

Gestion de la conformité améliorée

Le Big Data dans le secteur pharmaceutique joue un rôle important dans la facilitation de la conformité réglementaire. Les entreprises de l'industrie pharmaceutique sont soumises à un réseau complexe de réglementations, notamment les BPF (bonnes pratiques de fabrication) et les BPC (bonnes pratiques cliniques), ainsi qu'à des lois strictes sur la confidentialité des données. Les mégadonnées dans le secteur pharmaceutique peuvent aider les entreprises à surveiller les indicateurs de performance clés, à identifier les lacunes en matière de conformité et à résoudre les problèmes potentiels de manière proactive.


Les entreprises pharmaceutiques peuvent minimiser les risques réglementaires en détectant très tôt les anomalies , les déviations et les activités non conformes en utilisant des systèmes de surveillance automatisés et des solutions d'analyse de mégadonnées . De plus, en combinant des données historiques, des algorithmes d'apprentissage automatique et des techniques statistiques avancées, les sociétés pharmaceutiques peuvent développer des modèles prédictifs qui anticipent les risques potentiels de qualité, optimisent les calendriers de maintenance préventive et facilitent la prise de décision basée sur les données.

Ventes et marketing

En utilisant le Big Data pharmaceutique, les entreprises peuvent prédire les tendances du secteur et anticiper les ventes de médicaments spécifiques en fonction de facteurs démographiques. Cela peut aider à adapter les campagnes de marketing pharmaceutique au comportement des clients.


Comme dans le cas d'utilisation décrit ci-dessus, l'extraction des données disponibles sur Internet, y compris les données des médias sociaux, pourrait aider les sociétés pharmaceutiques à évaluer le sentiment des clients autour de leurs produits. Cela peut aider les sociétés pharmaceutiques à comprendre comment leurs produits sont reçus.

Les défis de l'adoption du Big Data dans l'industrie pharmaceutique

Malgré les avantages que le big data génère dans l'industrie pharmaceutique, les entreprises sont toujours soucieuses de revoir leurs processus de gestion des données. Nous avons dressé une liste des défis auxquels les entreprises peuvent être confrontées lors de l'adoption du Big Data dans le secteur pharmaceutique afin de rendre votre processus de mise en œuvre moins risqué.

Défi 1. Intégration des sources de données

Avoir toutes les sources de données bien liées est l'un des principaux défis que le secteur pharmaceutique doit surmonter pour récolter les bénéfices du big data. L'utilisation efficace des mégadonnées dans le secteur pharmaceutique nécessite l'intégration des données générées à toutes les étapes du processus de développement de médicaments, de la découverte à l'approbation réglementaire en passant par l'application dans le monde réel.


L'intégration de données de bout en bout nécessite de nombreuses fonctionnalités : de la collecte de données fiables à la connexion de ces sources, en passant par la réalisation d'une assurance qualité robuste, la gestion des flux de travail, etc.

De manière générale, nous vous recommandons d'éviter de refondre vos infrastructures de données en une seule fois en raison des risques et des coûts impliqués. Une approche plus sûre consiste à intégrer vos sources de données étape par étape, en identifiant les types de données spécifiques qui doivent être traités en premier et en créant des capacités d'entreposage supplémentaires si nécessaire. L'objectif est de s'attaquer d'abord aux données critiques pour obtenir un retour sur investissement le plus rapidement possible. En parallèle, vous pouvez développer des scénarios d'intégration de sources de données de moindre priorité.

Défi 2. Surmonter les silos organisationnels

L'intégration de données de bout en bout est à peine possible sans surmonter les silos au sein d'une organisation. Traditionnellement, dans le secteur pharmaceutique, différentes équipes étaient responsables de leurs systèmes et de leurs données. Le passage à une approche centrée sur les données avec un propriétaire clair pour chaque type de données dans les silos fonctionnels et via le pipeline de données facilitera la capacité à générer de la valeur à partir du Big Data dans le secteur pharmaceutique.

Défi 3. Conformité réglementaire

En adoptant le Big Data dans le secteur pharmaceutique et en déployant des systèmes de gestion centralisée des données, vous devez vous assurer que les données sont traitées en toute sécurité. La FDA exige que les logiciels utilisés dans le secteur (par exemple, les systèmes utilisés pour gérer les dossiers de santé électroniques ou gérer les essais cliniques) répondent à un certain nombre d'exigences, notamment les procédures de contrôle d'accès, la vérification de l'identité des utilisateurs, le suivi des actions effectuées, etc. Lors de la planification de votre projet, assurez-vous d'étudier attentivement les exigences de conformité pertinentes et de les intégrer dans la conception de votre solution de gestion des données.

Défi 4. Manque de talents pour gérer le Big Data

Le secteur pharmaceutique a traditionnellement été un lent à adopter la technologie, de sorte que de nombreuses entreprises manquent encore des talents nécessaires pour réaliser leurs plans ambitieux. Les acteurs de l'industrie pharmaceutique doivent réfléchir à un moyen approprié de combler le déficit de connaissances, qu'il s'agisse de former des talents internes ou de faire appel à des équipes externes.

Au lieu d'une conclusion

Le Big Data dans le secteur pharmaceutique présente de vastes opportunités d'innovation, d'efficacité et d'amélioration des résultats pour les patients. Alors que le marché des mégadonnées pharmaceutiques continue de croître, les entreprises adoptent cette technologie transformatrice pour rester compétitives.


Si vous cherchez à libérer le véritable pouvoir du Big Data et à faire des percées dans le développement de médicaments, contactez nos experts et nous répondrons à toutes les questions qui restent sans réponse.


Également publié ici .