人工知能はあらゆる種類のことを行います….ゲノミクスも同様です。
遺伝子工学は、常に SF 映画やテレビ番組で頼りになる陰謀でした。優れた能力と独自の DNA を持つ遺伝子変異した人間という考えは、今でもマーベル ファンや興行収入に波及効果をもたらしています。
しかし、実生活で遺伝子を変更できるとしたらどうでしょうか? CRISPR 遺伝子編集は 2012 年からそれを行っています (ただし、ウルヴァリンやマグニートーはありません)。 2022 年には、この強力な遺伝子工学技術が人工知能によって補完されます。
これらの力に加わることで、CRISPR の史上最高の外観を実現し、ヘルスケア業界に革命を起こすことができます。
今日は、AI を活用した遺伝子工学の基本を説明し、私の会社のプロジェクトの 1 つを例として使用して、マシン インテリジェンスがもたらす違いを示します。
簡単に言えば、ゲノム編集とは、科学者が植物、動物、人間などの生物の DNA を変更できるようにする技術です。
これには、遺伝子の DNA 配列を変更して、遺伝性疾患を修正したり、病気に対する抵抗力を与える遺伝子を変更したりすることが含まれます。 CRISPR ベースのゲノム編集ツールの開発は、この分野に革命をもたらし、遺伝子をより簡単かつ迅速に変更できるようにしました。
そのため、2012 年以降、遺伝子工学は主に CRISPR-Cas 9 、またはゲノムを変更するためのユニークな「カットアンドペースト」ツールである CRISPR に関連付けられてきました。
CRISPR-Cas9 には大規模なアプリケーション領域があります。したがって、遺伝子を沈黙させたり活性化したり、新しい遺伝子を除去したり導入したりできます。これまでのところ、この技術は、 がんや感染症など、さまざまな疾患の治療にすでに使用されています。また、CRISPR は、蚊の個体数を抑制してマラリアを抑制し、エンジニアリング農業における作物の気候の回復力を高めるために使用されています 。
潜在的な使用例としては、 CRISPR は、遺伝性疾患の最小化、病気の蔓延の治療と予防、および作物の成績の向上に適しています。 ExxonMobilは、2025 年までに藻類バイオディーゼルを生産するための遺伝子改変も期待しています。
しかし、すべてが CRISPR による虹と蝶である場合、なぜ私はこれを書いているのでしょうか?
答えは簡単です。**CRISPR Cas9 は、私たちが望んでいる救世主ではありません。
増加する証拠は、ポジティブな DNA 変化とともに、CRISPR が偶発的な意図しない遺伝子変化の罪を犯していることを示唆しています。したがって、誤ったオンサイト編集ゲノム編集結果は、分析されたヒト細胞の約16%に存在します。
これは、オフターゲット効果が遺伝子の機能を変化させ、染色体の不安定性を引き起こし、遺伝子の可能性と臨床手順への応用を制限する可能性があることを意味します。さらに、この手法の編集パフォーマンスは、多数の要因の影響を受け、正常に編集されたセルの数を減らす可能性があります。
そして、ここで遺伝子工学と人工知能が衝突します。
先駆的なソリューションとブレークスルーに関しては、人工知能とその派生物が通常の容疑者です。ゲノミクスも例外ではありません。分析機能と予測機能のおかげで、AI テクノロジーは CRISPR の編集機能を増幅することで、命を救い、命を救います。
意味のあるパターンとアルゴリズムで AI チップが組み込まれている主な領域について見ていきましょう。
上で指摘したように、CRISPR Cas9 は伝統的な遺伝子編集ツールであり、遺伝子の欠陥を修正して病気を治療します。この取り組みの成功は、適切な細胞と適切な組織を標的とすることにあります。ただし、予期しない切断の可能性があるため、CRISPR の大規模な採用が妨げられ、その可能性が覆い隠されています。
オフターゲット変異は、長い間研究の対象となってきました。その結果、科学者は、ターゲット効果とオフターゲット効果を評価する複数のスコアリング システムを作成しました。ただし、既存のオフターゲット予測方法の大部分は、継続的な自己学習のために進化する CRISPR-Cas9 データを考慮に入れることができません。
最も重要なことは、従来のスコアリング ツールは「CRISPR-Cas9 遺伝子編集におけるオフターゲット アクティビティに影響を与える可能性がある、ミスマッチ サイトとマッチ サイト間の潜在的な関係」を分析しないことです。[1]
そして、ここに人工知能が介入します。
比類のない精度スコア (約 97% ) でターゲット効果とオフターゲット効果の両方を予測することにより、CRISPR Cas9 をより正確にします。技術的な観点からは、ディープ ニューラル ネットワークと ML アルゴリズムの両方を適用して予測を生成できます。
モデルをトレーニングするために、エンジニアは通常、パフォーマンス ベンチマークのために、CRISPOR などのターゲット外のデータセットをアルゴリズムにフィードします。追加の評価も大歓迎であり、別のオフターゲット データセットを追加することで実行できます。
Microsoft による計算モデルは、AI が遺伝子編集の精度をさりげなく救った顕著な例です。このツールにより、科学者は遺伝子編集に最適な部位を特定できると同時に、副作用の可能性を減らすことができます。
一部の病気は人の遺伝学によって引き起こされる可能性があるため、科学者は何年もの間、私たちの遺伝子構成を調べようとしてきました.ゲノム配列決定は、研究をサポートし、生物のゲノムの完全な DNA 配列または構成をより適切に決定するのに役立ちます。
シーケンシングは、健康状態や病気に関連している可能性のある遺伝的バリアントや突然変異を特定するために使用されます。現在、この技術は、出生前診断やがん治療など、いくつかの医療用途で使用されています。
昨年、最初のヒトゲノム配列のドラフトが作成されてから20 周年を迎えました。この長期にわたる研究により、前例のない量のゲノムデータが流入しました。今後 10 年以内に、ゲノミクス研究は2 エクサバイトから 40エクサバイトのデータを生成するため、進歩は停滞します。
幸いなことに、複雑で巨大なデータ分析は、まさに人工知能と機械学習の専門分野です。ゲノムデータ処理を自動化することで、研究者はわずかな時間でゲノムデータを解釈して処理することができます。逆に、従来の遺伝子パネル分析では、結果が出るまでに約 2 週間かかります。**
AI 分析の速度を概観するために、スタンフォード大学、NVIDIA などの研究者は、5 時間 2 分で DNA シーケンスを行う AI メソッドを構築しました。これにより、最速の DNA シーケンス ツールとしてギネス世界記録に登録されました。
超高速のデータ処理に加えて、人工知能は DNA 配列のバリアントを識別するのに役立ちます。これらのバリアントは、病気や遺伝性疾患に関連している可能性があります。アルゴリズムを使用して、遺伝子構成に基づいて特定の薬にどのように反応するかを予測することもできます。これらの洞察により、研究者は効果的な治療、感受性、および病気の原因となる突然変異についてよりよく理解することができます。
同じように、リアルタイムのナノポア DNA シーケンサー処理は、長い間ゲノミクスの課題のままでした。この独自の技術により、長い DNA または RNA フラグメントの直接分析が可能になります。逆に、分析が遅いと、敗血症やその他の緊急の状態にある患者の生存率が低下する可能性があります。
私たちのチームが、リアルタイムのナノポア シーケンスの課題を解決する先駆的なソリューションの構築に関与したことを光栄に思います。
データ サイエンティストであり、Google Cloud Platform のシニア デベロッパー アドボケイトであるアレン デイと協力して、生物汚染物質や抗生物質耐性遺伝子などを検出するリアルタイム DNA シーケンス分析アプリケーションを開発しました。
包括的なデータの視覚化のおかげで、医療専門家は患者の治療計画についてデータに基づいた決定を下すことができます。コードはGitHubで入手できます。
人間の健康への影響は多くの注目を集めていますが、遺伝子の配列決定と分析は、農業や畜産業においても革命的なものになる可能性があります.
遺伝子検査は新しいものではありませんが、予測遺伝子検査と人工知能の組み合わせは、エキサイティングな新しい開発です。特定の病気を発症する可能性があるかどうかを予測する場合、通常、予測は非常に不正確です。**
しかし、人工知能の助けを借りて、これはもはや当てはまらないかもしれません.そのため、Sutter Health とジョージア工科大学の研究者は、深層学習を使用して電子健康データを分析し、心不全を回避しています .このようにして、私たちは反動的なままにするのではなく、積極的な医療アプローチに向かって進んでいます.
もう 1 つの例は、メラノーマ予防治療のためのディープ ラーニング アルゴリズムを開発した MIT のチームです。このアルゴリズムは、初期段階のメラノーマを迅速に特定してスクリーニングできます。後者は、世界中の皮膚がん関連死の 70% 以上を占めています。**
新生児の遺伝子スクリーニングも、インテリジェントなアルゴリズムによって強化されています。そこで、 国立小児病院の研究者は、迅速な遺伝子スクリーニングを行う機械学習ツールを構築しました。その結果、迅速かつ正確な分析により、子供の遺伝的症候群の診断を加速できます。さらに、人工知能は、利用可能なデータに基づいて、遺伝性疾患の治療に起因する結果とリスクを予測できます。**
**
私の投稿からも明らかなように、 AI とヘルスケアの相乗効果はあらゆる医療分野に存在します。ゲノム データに人工知能を適用することで、研究者はさまざまな生物の複雑なゲノム プロファイルをよりよく理解できるようになります。
AI の助けを借りて、生物学者はより野心的なゲノミクス プロジェクトに取り組み、実験結果をより迅速に分析できるようになります。ビッグデータと機械学習を組み合わせることで、人間が識別しにくいゲノムデータのパターンを特定することができます。最終的に、AI と機械学習は、私たちの遺伝子構成や他の生物の遺伝子構成の理解を加速させます。