paint-brush
製薬におけるビッグデータ: その概要とその使用方法@itrex
723 測定値
723 測定値

製薬におけるビッグデータ: その概要とその使用方法

ITRex13m2023/06/23
Read on Terminal Reader

長すぎる; 読むには

私たちは製薬におけるビッグデータの可能性を調査し、ビッグデータ技術が医薬品の開発方法を変える本質的な方法を探ります。
featured image - 製薬におけるビッグデータ: その概要とその使用方法
ITRex HackerNoon profile picture
0-item

記事の概要:

  • 製薬部門は、電子医療記録、ゲノム情報、現実世界の証拠など、多くのデータにアクセスできます。このすべてのデータを組み合わせたものをビッグ データと呼びます。ビッグ データに隠されたパターンを利用すると、そのセクターに計り知れない価値をもたらすことができます。

  • ビッグデータを利用することで、製薬業界は創薬から始まり、臨床試験や規制当局の承認を経て、マーケティングや上市後のモニタリングまで、新しい標的の特定に至るまで、医薬品開発プロセスの各段階で改善を推進することができます。

  • 製薬分野でのビッグデータの導入は、企業が組織のサイロを克服し、異種のデータソースをシームレスに統合し、法規制順守を確保する必要がある困難な事業です。


3 年前、製薬業界は前例のない課題に直面しました。現在、この危機で学んだ教訓が業界全体の変化を促進しています。


新型コロナウイルスが世界中で急速に感染拡大してからしばらくして、この騒動は始まった。製薬会社は、必要としている患者への重要な医療製品の供給を継続しながら、新型コロナウイルス感染症の新しいワクチンの開発に努め、世界的な注目を集めた。


このセクターは危機に見事に耐えた。しかし、明らかになったのは、製薬会社にはもはや事後対応的な危機管理を行う余裕がないということです。業界が長年懸案だった問題と戦うのに役立つ新しいパラダイムが出現するはずです。


  • 新薬の開発費は2022年に22億8,400万ドルに達する
  • 平均サイクルタイムは 2022 年には 7.09 年に増加
  • 製薬研究開発への投資収益率は 1.2% に低下しました。


業界関係者は、これらの問題と戦うために、科学的パートナーシップを締結し、新興市場に投資し、製品ポートフォリオを多様化する可能性があります。ただし、ビッグ データ コンサルティング サービス製薬ソフトウェア ソリューションを提供してきた 10 年の経験を持つテクノロジー愛好家は、別の方法、つまりデータに基づく方法を検討することをお勧めします。


このブログ投稿では、製薬におけるビッグデータの可能性を検討し、ビッグデータ技術が医薬品の開発、承認、販売の方法を変える本質的な方法を探ります。

製薬業界におけるビッグデータとは何ですか?また、それはどのように価値に変換されるのでしょうか?

製薬部門は膨大な量の情報を生成します。臨床試験データ、電子医療記録、ゲノミクス情報、現実世界の証拠、患者から報告された転帰など、これらすべてのデータエントリを組み合わせたものをビッグデータと呼ぶことができます。


基本的に、ビッグ データは、分析を通じて洞察に変換できる、あらゆる形式およびあらゆるソースからの大量かつ多様な情報です。


ビッグデータを大きな洞察に変換する標準的なプロセスは次のとおりです。

すべては関連データを収集することから始まります。その種類と発生源は大きく異なる場合があります。製薬業界のビッグデータを構成する一般的な種類の情報は次のとおりです。


  • 医薬品の評価中に収集された情報を含む臨床試験データ。これには、研究プロトコル、参加者の人口統計、病歴、治療反応、有害事象、臨床検査結果などが含まれる場合があります。
  • 実際の臨床現場で管理された臨床試験環境以外で収集されたデータを含む現実世界の証拠。それは、患者から報告された転帰だけでなく、保険請求、ウェアラブルや電子医療記録からのデータに及ぶ可能性があります。
  • DNA 変異、遺伝子発現プロファイル、ゲノムバイオマーカーなどの個々の遺伝情報、および創薬に関連する分子の構造、相互作用、機能に関する情報を含むゲノミクスおよび分子データ
  • 患者の病歴、アレルギー、診断、検査結果、その他の関連情報を含む電子医療記録
  • X 線、MRI、CT スキャンにまたがる画像データ
  • 医薬品に関連する有害事象と安全性の懸念を明らかにするファーマコビジランスと有害事象のレポート
  • 研究論文、会議議事録、特許に及ぶ科学文献
  • 「オミクス データ」とは、ゲノミクス、メタボロミクス、プロテオミクス、トランスクリプトミクスなど、いわゆる「オミクス」分野から生成された大規模なデータセットを指します。


複数のソースから取得された情報は、データ ウェアハウス (すべての医薬品ビッグ データの集中ストレージ) に読み込まれる前に、クリーニングと変換を受けます。これは、データが明確で正確であり、統一された形式に変換されていることを保証する重要な手順です。クリーンアップされ、整理されたデータはデータ ウェアハウスに保存され、分析のために簡単にアクセスできます。

製薬業界におけるビッグデータの重要なユースケース

医薬品開発は長くて危険な道のりです。市場に投入される新薬候補はほとんどありません。前臨床試験に入る 5,000 の化合物のうち、人体試験に進むのは平均して 5 つだけです。そして、臨床使用が承認されるのは、最初の 5,000 件のうち 1 件だけです。

幸いなことに、医薬品開発プロセスのあらゆる段階で、医薬品ビッグデータが役立つ可能性があります。

創薬

医薬品の研究開発における基礎段階である創薬は、研究者が疾患の背後にあるプロセスを細胞レベルまたは分子レベルで理解することから始まります。潜在的な標的が特定されると、プロセスは続いて、標的と相互作用してその活性を妨げる可能性のある化合物を検索します。


この段階で研究者が直面する主な課題には、効果的で安全な標的を特定すること、また、望ましい効力、選択性、安全性プロファイルを持つ化合物を見つけることが含まれます。


製薬ビッグデータに注目することで、研究者はこれらの問題を解決し、創薬のスピードと有効性を向上させることができます。

ターゲットの特定と検証

ビッグデータを使用して、さまざまなソースからのデータセットを統合できます。これらの多次元データセットを分析することで、研究者は新しい標的、薬剤適応症、薬剤反応バイオマーカーをより迅速に、より少ないリスクで特定できます。


最近、前臨床創薬のための多くの参考医薬品ビッグ データ セットが作成され、公開されています


  • dbSNP : 1 億 5,000 万を超えるヒト参照 SNP を含む、広範囲の生物の一塩基多型 (SNP)。
  • dbVar : 210 万以上のヒト CNV を含む、さまざまな生物の公開された研究によって主に生成されたゲノム構造の変異。
  • COSMIC : 専門家のキュレーションとゲノム全体のスクリーニングから得られた主に体細胞変異で、350 万を超えるコード変異が含まれます。
  • 1000 Genomes Project : ヒトの遺伝的変異に関する包括的なリソースを提供する多数の人々のゲノム。このデータセットには 2,500 を超えるサンプルが含まれています。
  • TCGA : 10,000 サンプルにわたる 30 以上のがんのゲノミクスおよび機能的ゲノミクス データ リポジトリ。主なデータの種類には、突然変異、コピー数、mRNA、タンパク質発現が含まれます。
  • GEO : NCBI がホストする機能ゲノミクス データ リポジトリ。160 万を超えるサンプルが含まれます。
  • ArrayExpress : EBI がホストする機能ゲノミクス データ リポジトリ。180 万を超えるサンプルが含まれます。
  • GTEx : 45 種類の組織にわたる 7,000 以上のサンプルを含む、正常組織のトランスクリプトーム プロファイル。
  • CCLE : 1,000 を超えるがん細胞株の遺伝的および薬理学的特性評価。


これらの製薬ビッグデータセットは、標的分子を特定するために広く使用されています。

たとえば、創薬において、遺伝子発現は、標的選択の情報を提供するために最も広く使用されている分子の特徴の 1 つです。


研究者グループは、公開されている製薬ビッグデータセットの 1 つに注目し、注目の 844 個の乳がんサンプルのmRNA 発現を調べ、それらを正常な乳房組織と比較しました。データセットに含まれるビッグデータを解析した結果、がん性サンプルではMTBP遺伝子が有意に上昇していることが判明した。この発見と生存データを相互参照すると、MTBP の上昇が患者の生存率低下と大きく関連していることも明らかになりました。


上の例では、ターゲットは研究者によって提案されました。製薬業界のビッグデータでは、公開されているビッグデータを分析することでターゲットを直接発見することもできます。このようにして、研究者グループは、特定の標的を念頭に置くことなく、乳がんにおいて発がん性のある創薬可能なキナーゼを探索しました。彼らは、公的製薬ビッグデータセットからの遺伝子発現データと乳房腫瘍開始細胞の遺伝子発現プロファイルを分析し、がん細胞株でmRNA発現が高い13のキナーゼを発見しました。その後の検証により、候補リストは 8 つのキナーゼに減らされ、そのうち 3 つが治療標的として選択されました。

予測モデリング

従来、研究者は植物または動物の化合物を使用して候補薬を試験していました。 2022年9月、米国上院はコンピューターモデルを含む動物実験の代替手段の使用を許可するFDA近代化法2.0を可決した。


コンピューターモデルに基づくアプローチにより、動物実験に伴う不正確さや倫理的問題を回避することができます。また、この分野が人間の生物学的活動の実際の表現に近づく可能性もあります。


製薬業界で使用される予測モデリング技術の 1 つは薬物動態モデリングです。製薬ビッグデータ、数式、コンピューターシミュレーションを使用して、薬が人体内でどのように「動作」するかを理解してください。この方法は、薬物がどのように吸収、分布、代謝、排泄されるかなど、薬物が摂取されると何が起こるかを予測するのに役立ちます。


製薬業界のビッグデータに基づいて構築されるもう 1 つの有望な技術は、オルガンオンチップ技術です。 Organ on Chips は、マイクロ流体セル構造を使用して、インビトロ疾患モデリング、薬物検査、精密医療のために人間の臓器の機能と生理学的環境を模倣するポリマー チップです。私たち ITRex は、動物実験に関連する問題に対処する有効性を示す 臓器オンチップ プラットフォームの作成を支援してきました。このプラットフォームは 100 以上の研究室で採用され、医薬品開発の加速とそれに関連するコストの削減に役立ちました。

精密医療

プレシジョン・メディシンは、適切な患者に適切なタイミングで適切な治療を提供することを目的としたアプローチと定義できます。従来、ほとんどの臨床問題に対して、精密な戦略はほとんど野心的なものでした。今日、製薬分野でのビッグデータの使用が増加することで、その野心的な目標の達成が約束されています。


ビッグデータに基づいた医薬品開発は、事前知識への依存度が低いため、疾患に関連する予期せぬ経路を明らかにし、より高い精度と個別化への道を開く可能性があります。一部の機関はすでにこの新しいアプローチを活用しています


たとえば、同様のがんサブタイプを持つ患者は、同じ化学療法を受けた場合に異なる反応を示すことがよくあります。薬物反応はゲノムの不安定性によって影響を受けると考えられています。ビッグデータの使用は、ゲノミクスと化学療法耐性、毒性、感受性との間の複雑な関係を研究するための一般的な方法になりつつあります。


たとえば、科学者は、Cancer Genome Atlas 研究ネットワークによって立ち上げられた Pan-Cancer プロジェクトを通じて、新たながんの異常を発見できます。 「がん細胞株百科事典」や「がんにおける薬剤感受性のゲノミクス」など、他のいくつかのプロジェクトも、ゲノムバイオマーカーと薬剤感受性との関連を調査する製薬ビッグデータを生成しています。

臨床試験

臨床試験の目的は、治療法が人間にとって安全で効果的かどうかを判断することです。

通常、試験は 3 つの連続した段階で行われます。第 1 相では薬を小グループの健康な人々で試験し、第 II 相では薬を対象となる特定の症状を示す大規模な人々で試験します。より多くの患者が関与するフェーズIIIへの道。


このプロセスは常に長くて退屈なものでした。幸いなことに、製薬業界におけるビッグデータの導入の広がりに伴い、臨床試験も変化しつつあります。

採用の迅速化

世界中の試験の10件中9件では、目標期間内に十分な人数を集めることができません。一部の治験、特に希少疾患や生命を脅かす疾患の治療法を試験する治験では、十分な人数を集めるのに苦労しています。通常、臨床試験には 2 つのグループが含まれます。1 つは新しい治療法を試験する試験グループ、もう 1 つは治療を行わない、プラセボ、または現在の標準治療を受ける対照グループです。


生命を脅かす状態にある患者は迅速な助けが必要であることを念頭に置き、無作為に対照群に割り付けられることを望んでいません。比較的まれな症状の患者を募集する必要があるため、募集期間は数か月にも及びます。


ビッグデータは、コントロールグループを雇う必要性を完全に回避するのに役立ちます。過去の治験で生成された医薬品ビッグデータをもとに作成した「仮想対照群」を活用するというものだ。

考えられる対照群の候補を見つけるために、研究者は、病気の主な特徴や病気の進行度など、治験からの主要な適格基準を使用します。標準的な臨床試験では、同様の方法で対照患者を選択します。違いは、現在の試験中に収集されたデータに依存するのではなく、過去のデータが使用されることです。しかし今のところ、仮想対照群は従来の臨床試験に代わるものではなく、むしろ新しい治療法が追求する価値があるかどうかを評価する迅速な方法です。


製薬臨床試験におけるビッグデータのもう 1 つの側面は、ターゲットを絞った採用を可能にすることです。新しいテクノロジーを使用すると、研究者はソーシャルメディアなどの新しいデータソースに基づいて患者を登録できるようになります。遺伝情報、病気の状態、個人の特性などの基準を比較検討することが容易になります。

効率的な治験管理

製薬業界でビッグデータを使用すると、臨床試験の設計と管理の方法が変わる可能性があります。現在、研究者は、薬物曝露レベル、薬物によってもたらされる免疫、治療の忍容性と安全性、および新兵の安全にとって重要なその他の要素を、試験終了後だけでなくリアルタイムで追跡および検出できるようになりました。


研究者が製薬ビッグデータに注目することで得られる利益は次のとおりです。


  • 最適なサンプル サイズの計算: 過去の試験データを分析すると、サンプル サイズの計算に役立ちます。
  • 層別化およびサブグループ分析: ビッグデータは、治療反応に影響を与える患者の特徴、バイオマーカー、または遺伝的要因を特定するのに役立ちます。これは、研究者が患者をサブグループに階層化し、特定の集団内での治療効果を分析するのに役立ちます。
  • 適応型治験設計: 製薬ビッグデータを分析することで適応型治験設計が容易になり、研究者は中間結果に基づいて治験パラメータを変更できます。研究者は、サンプルサイズや登録基準などの治験パラメータの変更について情報に基づいた意思決定を行うために、傾向、治療反応、安全性シグナルを詳しく調査できるようになりました。

品質管理とコンプライアンス

製薬におけるビッグデータは、医薬品の品質管理に対する従来のアプローチに革命をもたらし、製薬会社がより優れた品質管理プロセスを導入し、コンプライアンスへの取り組みを合理化し、より安全でより効果的な医薬品を提供できるようにします。製薬ビッグデータが大きな影響をもたらす可能性がある分野には、次のようなものがあります。

医薬品安全性監視と副作用モニタリングの向上

臨床試験でサンプリングされる人の数が限られているため、多くの副作用、特にまれな副作用は検出されないままです。だからこそ、発売後も薬物を監視する必要があるのです。

ソーシャル メディアが顧客の懸念を表明し、副作用を報告するためのプラットフォームになっていることを考慮して、製薬会社はこの貴重な情報を活用するためにビッグ データ ツールを活用し始めました。


ソーシャルメディアから集めた患者報告の薬物副作用は、医療専門家が記録したものよりも正確であることが証明される場合もあります。 FDAとエピデミコが実施した調査では690万件のツイートを調査し、そのうち4,401件が有害事象報告に類似していることが判明した。この調査結果をFDAが保有するデータとさらに比較したところ、非公式のソーシャルメディア報告と臨床試験で文書化された報告との間に高い関連性があることが明らかになった。

コンプライアンス管理の強化

製薬業界のビッグデータは、規制遵守を促進する上で重要な役割を果たします。製薬業界の企業は、厳格なデータプライバシー法だけでなく、GMP (適正製造基準) や GCP (適正臨床基準) などの複雑な規制の対象となります。医薬品のビッグデータは、企業が主要業績評価指標を監視し、コンプライアンスのギャップを特定し、潜在的な問題に積極的に対処するのに役立ちます。


製薬会社は、自動監視システムとビッグデータ分析ソリューションを使用して、異常、逸脱、および非準拠活動を早期に検出することで、規制リスクを最小限に抑えることができます。さらに、過去のデータ、機械学習アルゴリズム、高度な統計手法を組み合わせることで、製薬会社は潜在的な品質リスクを予測する予測モデルを開発し、予防保守スケジュールを最適化し、データ主導の意思決定を促進できます。

セールスとマーケティング

製薬ビッグデータを使用することで、企業は業界の動向を予測し、人口動態要因に基づいて特定の医薬品の売上を予測できます。これは、製薬マーケティング キャンペーンを顧客の行動に合わせて調整するのに役立ちます。


前述のユースケースと同様に、ソーシャル メディア データを含むインターネット上で入手可能なデータをスクレイピングすることで、製薬会社が自社製品に対する顧客のセンチメントを評価するのに役立つ可能性があります。これは、製薬会社が自社の製品がどのように受け入れられているかを理解するのに役立つ可能性があります。

製薬分野でのビッグデータ導入の課題

ビッグデータが製薬業界にもたらしている恩恵にもかかわらず、企業は依然としてデータ管理プロセスの徹底的な見直しを意識しています。導入プロセスのリスクを軽減するために、製薬業界でビッグデータを導入する際に企業が直面する可能性のある課題のリストをまとめました。

課題 1. データソースの統合

すべてのデータ ソースを適切にリンクすることは、製薬業界がビッグ データのメリットを享受するために克服すべき重要な課題の 1 つです。製薬分野でビッグデータを効果的に使用するには、発見から規制当局の承認、実際の適用に至るまで、医薬品開発プロセスのすべての段階で生成されたデータを統合する必要があります。


エンドツーエンドのデータ統合には、信頼できるデータの収集、これらのソースの接続、堅牢な品質保証の実行、ワークフローの管理など、多くの機能が必要です。

一般に、リスクとコストがかかるため、データ インフラストラクチャを一度に全面的に刷新することは避けることをお勧めします。より安全なアプローチは、データ ソースを段階的に統合し、最初に処理する必要がある特定のデータ タイプを特定し、必要に応じて追加のウェアハウス機能を作成することです。目標は、重要なデータに最初に取り組み、できるだけ早く ROI を達成することです。並行して、優先度の低いデータ ソースを統合するシナリオを開発できます。

課題 2. 組織のサイロ化を克服する

組織内のサイロを克服しない限り、エンドツーエンドのデータ統合はほとんど不可能です。従来、製薬業界では、さまざまなチームがシステムとデータに対して責任を負っていました。機能サイロ全体およびデータ パイプラインを通じて、データの種類ごとに明確な所有者を持つデータ中心のアプローチに移行することで、製薬業界のビッグ データから価値を生み出すことが容易になります。

課題 3. 規制遵守

製薬業界でビッグデータを採用し、一元的なデータ管理システムを展開するには、データが安全かつ確実に処理されるようにする必要があります。 FDA は、この分野で使用されるソフトウェア (電子医療記録の処理や臨床試験の管理に使用されるシステムなど) が、アクセス制御手順、ユーザーの身元確認、実行されたアクションの追跡などを含む多くの要件を満たすことを要求しています。プロジェクトを計画するときは、関連するコンプライアンス要件を注意深く検討し、それをデータ管理ソリューションの設計に組み込むようにしてください。

課題 4. ビッグデータを扱う人材の不足

製薬業界は伝統的にテクノロジーの導入が遅かったため、多くの企業が野心的な計画を実現するために必要な人材を依然として不足しています。製薬業界の関係者は、社内の人材を育成するか、外部チームに頼るかなど、知識のギャップを埋める適切な方法を考える必要があります。

結論の代わりに

製薬業界のビッグデータは、イノベーション、効率性、患者の転帰改善のための膨大な機会をもたらします。製薬ビッグデータの市場が成長を続ける中、企業は競争力を維持するためにこの革新的なテクノロジーを採用しています。


ビッグデータの真の力を解き放ち、医薬品開発のブレークスルーを推進したい場合は、当社の専門家にご連絡ください。未解決の質問にはすべてお答えします。


ここでも公開されています。