paint-brush
Foundation AI モデルの概要: タイプ、ユースケース、開始方法@itrex
4,099 測定値
4,099 測定値

Foundation AI モデルの概要: タイプ、ユースケース、開始方法

ITRex9m2023/03/20
Read on Terminal Reader

長すぎる; 読むには

Foundation モデルは、熟練した AI コンサルタントの指導の下、膨大な量のラベルのないデータでトレーニングされた大規模な機械学習モデルです。このようなモデルは、紙ベースのドキュメントを編集可能なテキスト ファイルに変換することから、ソーシャル メディアで顧客の感情を明らかにすることまで、さまざまなタスクを強化または自動化するために使用できます。
featured image - Foundation AI モデルの概要: タイプ、ユースケース、開始方法
ITRex HackerNoon profile picture
0-item

世界中の組織が長い間 AI への投資を続けてきましたが、プロトタイプから生産に至る人工知能プロジェクトの数は、依然として 53% 前後で変動しています


専門家は、これは技術スキル、人的資源、および分離されたAIの概念実証 (PoC) を他のユース ケースに拡張するためのツールが不足していることが原因であると考えています。もちろん、さまざまなタスク用に個別の AI モデルをトレーニングするためのおそらく高いコストも必要です。


ファウンデーション モデル (つまり、熟練した AI コンサルタントの指導の下、膨大な量のラベル付けされていないデータでトレーニングされた大規模な機械学習モデル) は、困難な AI のスケーラビリティとコストの問題に対する究極の答えとなる可能性があります。


あなたの会社は、紙ベースのドキュメントを編集可能なテキスト ファイルに変換することから、 ソーシャル メディアのレビューで顧客の感情を明らかにすることまで、さまざまなタスクを強化または自動化するための出発点としてこのようなモデルを使用できます。そこから優れた AI を構築し、基盤モデルを将来のタスクやユースケースに適応させます。

基盤モデルとは何ですか?また、それらは会社が AI で優れているのにどのように役立つでしょうか?

岩の下に住んでいない限り、 OpenAI の ChatGPTについて聞いたことがあるでしょう。この言語モデルは、教師あり学習を使用して膨大な量の会話テキストを吸収しており、微調整段階では、人間のフィードバックからの強化学習 (RLHF) アプローチを採用しています。


ジェネレーティブ AI ソリューションは、 1,750 億のパラメーターに対して入力データを分析し、書き言葉を深く理解することができます。このスマートなツールは、質問への回答、テキストの要約と翻訳、特定のトピックに関する記事の作成、コードの記述などを行うことができます。必要なのは、 ChatGPT に適切なプロンプトを提供することだけです。


OpenAI の画期的な製品は、私たちが知っているAI アプリケーション開発を変革する基盤モデルの一例にすぎません。

私たちが知っているように、基盤モデルは AI 開発を混乱させます。ユースケースごとに複数のモデルをトレーニングする代わりに、事前トレーニング済みの AI ソリューションを活用して、複数の部門や職務にまたがるタスクを強化または完全に自動化できるようになりました。


ChatGPT のような基盤 AI モデルを使用すると、企業は、強化または自動化するすべてのタスクについて、アルゴリズムをゼロからトレーニングする必要がなくなります。代わりに、ユースケースに最適な基盤モデルを選択し、達成したい特定の目的に合わせてそのパフォーマンスを微調整するだけで済みます。


Foundation モデルは、トレーニング データを取得するのが困難または費用がかかりすぎる業界に最適です。これらの業界には、ヘルスケア、ライフ サイエンス、バイオテクノロジー、製造業などが含まれます。

基盤となる AI モデルにはどのような種類がありますか?

ビジネス アプリケーションでは、いくつかのタイプの基盤 AI モデルが一般的に使用されています。


  • 半教師あり学習モデルは、ラベル付きデータとラベルなしデータが混在するデータセットでトレーニングされます。目標は、ラベル付けされたデータを使用して、ラベル付けされていないデータに対するモデルのパフォーマンスを改善することです。 AI の専門家は、トレーニング データの取得が困難な場合や、企業にとって多大な費用がかかる場合に、半教師あり学習を利用します。これは、たとえば、さまざまなヘルスケア IT 規制が制定されている医療現場で発生する可能性があります。半教師ありモデルの一般的な例には、事前トレーニング済みのテキスト ドキュメントと Web コンテンツの分類アルゴリズムが含まれます。


  • 教師なし学習モデルは、ラベルのないデータセットで完全にトレーニングされます。トレーニング データのパターンを発見したり、独自に構造化したりします。このようなモデルは、とりわけ、トレーニング データセットで明らかにしたパラメーターに基づいて、情報をクラスターにセグメント化できます。 ML エンジニアは、自動エンコーダー、K-Means、階層的クラスタリング、およびその他の手法を利用して、教師なし機械学習ソリューションを作成し、その精度を向上させます。


  • 強化学習モデルは、特定のトレーニングなしで環境と相互作用します。望ましい結果を達成したとき、つまり、開発者が望んでいた予測を行ったとき、モデルは報われます。逆に、強化学習モデルは、誤った仮定を行うとペナルティを受けます。このアプローチにより、AI アルゴリズムは、教師ありおよび半教師ありのアルゴリズムよりも複雑な決定を下すことができます。実際の強化学習の例としては、自動運転車や AlphaGo のようなゲームをプレイする人工知能があります。


  • ジェネレーティブ AI モデルは、トレーニングされたデータに似た新しいデータを生成します。このデータには、テキスト、画像、オーディオ クリップ、およびビデオが含まれる場合があります。前のセクションで説明した ChatGPT ソリューションは、基盤 AI モデルのこのカテゴリに属します。ジェネレーティブ AI の他の例には、自然言語で記述された説明に基づいて画像を作成するDALL-E 2 ツールや、テキストベースの入力を使用してビデオ コンテンツを生成するSynthesia.ioビデオ プラットフォームが含まれます。

  • 転移学習モデルは、トレーニングされたもの以外のタスクを解決できます。たとえば、コンピュータ ビジョン エンジニアは、事前にトレーニングされた画像分類アルゴリズムをオブジェクト検出に活用できます。または、既存の NLP ソリューションを利用して、顧客の感情分析など、より知識集約的なタスクを実行します。一般的な事前トレーニング済みの機械学習ソリューションには、オブジェクトの分類と画像検出のための堅牢なモデルを含むコンピューター ビジョン ライブラリである OpenCV や、Generative pre-trained Transformer (GPT) などの Hugging Face の Transformers ライブラリ オファリングが含まれます。第 3 世代 (GPT-3) は、ChatGPT サービスを強化します。


  • メタ学習モデル は、タスク指向の同等のモデルとは異なり、文字通り学習することを学びます (しゃれは意図されていません)。特定の問題を解決するためにデータをむさぼり食う代わりに、そのようなモデルは問題解決のための一般的な戦略を開発します。このようにして、メタ学習ソリューションは、メモリや計算能力などのリソースをより効率的に使用しながら、新しい課題に簡単に適応できます。 ML の専門家は、トレーニング データが不足している場合や、企業がビジネスへの AI の実装に関する明確な計画を持っていない場合に、メタ学習を利用します。 TensorFlow、PyTorch、およびその他のオープンソースの機械学習ライブラリとフレームワークは、開発者がメタ学習手法を探索できるようにするツールを提供します。また、Google のようなクラウド コンピューティング プロバイダーは、ML の専門家や初心者が AutoML を使用してカスタムの機械学習モデルをトレーニングするのを支援しています。


特定のアプリケーションとデータの種類によっては、ある基盤モデルが別の基盤モデルよりも適切な場合があります。また、ビジネス目標を満たしている場合は、少し調整が必要なオープンソース ソリューションか、すぐに使用できるサードパーティ製品のいずれかを自由に選択できます。

次のプロジェクトで基礎 AI モデルを活用する 3 つの理由

スタンドアロンのタスク指向の機械学習モデルと比較して、基盤モデルは信頼性の高い AI ソリューションをより迅速かつ安価に作成するのに役立ち、関与するデータが少なくなり、微調整が最小限に抑えられます。言うまでもなく、単一の組織が取得できるよりも多くのデータでトレーニングされているため、基盤モデルは初日から高い精度を示します。


以下に、基礎 AI モデルの利点の概要を示します。


  • Foundation モデルは、AI をより速く、より安価に、より少ないリソースで実装するのに役立ちます。 AI ソリューションの作成と展開には、かなりの時間とリソースが必要です。新しいアプリケーションごとに、適切にラベル付けされた個別のデータ セットが必要です。持っていない場合は、その情報を検索、クレンジング、ラベル付けするデータ専門家のチームが必要になります。 IBM AI の CTO である Dakshi Agrawal 氏によると、基礎モデルは、特定のユース ケースに応じて、データのラベル付け要件を 10 倍から 200 倍削減するのに役立ち、大幅なコスト削減につながります。ビジネス面では、クラウド コンピューティングの費用の増加も考慮する必要があります。たとえば、Google は DeepMind に囲碁を教えるために 3,500 万ドルも費やしました。また、AI プロジェクトはその野心的な半分ではないかもしれませんが、クラウド サーバーのコストだけで300,000 ドルを簡単に費やして、AI アプリを稼働させることができます。ジェネレーティブ AI ソリューションなどの基盤モデルを使用するもう 1 つの理由は、R&D に多額の投資を行うことなく、さまざまなコンセプトのプロトタイプをすばやく作成してテストできることです。


  • 基礎となる AI モデルを再利用して、さまざまなアプリケーションを作成できます。その名前が示すように、AI 基盤モデルは、複数の AI アプリケーションの基礎として機能できます。車の運転を考えてみてください。運転免許証を取得すると、別の車を購入するたびに試験に合格する必要はありません。同様に、少量のラベル付きデータを使用して、テキストを要約してドメイン固有のコンテンツを処理する汎用基盤モデルをトレーニングできます。また、基礎モデルには「創発」機能も備わっています。つまり、モデルがトレーニングされると、対処するはずのない問題を解決したり、トレーニング データから予期しない洞察を収集したりすることを学習する可能性があります。


  • Foundation AI モデルは、企業の持続可能性目標の達成に役立ちます。 1 つの大規模な機械学習モデルをトレーニングすると、その生涯にわたって 5 台の車を走らせた場合と同じ環境フットプリントが発生する可能性があります。このような大量の二酸化炭素排出量は、企業の 66% と 49% がそれぞれエネルギー使用効率を高め、気候に優しい新しいサービスと製品を開発しているという事実とは対照的です。基礎となる AI モデルを使用すると、インテリジェント アルゴリズムをより迅速にトレーニングし、コンピューティング リソースを賢く利用できます。特に、ハードウェアの並列処理を利用して複数のタスクを同時に実行するモデルのアーキテクチャのおかげです。


「AI の未来」と見なされる基盤モデルは、人工知能を活用するための敷居を下げ、ビジネスが他のユースケースや会社全体でモデルをスケーリングするのを支援することで、失敗した AI の概念実証サイクルを終わらせる可能性があります。

しかし、すべての機会には挑戦が伴います。

基礎モデルを使用する際の考慮事項

基盤 AI モデルの唯一の明白な欠点は、説明可能性の欠如です。

大規模な基盤モデルは、非常に多くのトレーニング データを使用し、非常に多くの深いレイヤーを使用する可能性があるため、アルゴリズムがどのように結論に到達するかを判断するのが難しい場合があります。

財団モデルのブラックボックスの性質は、サイバー犯罪者にもバックドアを残します。ハッカーはデータ ポイズニング攻撃を開始し、 AI バイアスを導入して、人工知能の倫理的問題をさらに悪化させる可能性があります。


テクノロジー企業は、政府と力を合わせて公共の AI プロジェクトのインフラストラクチャを設定し、基盤となる AI モデルの使用をめぐる争いを避ける必要があります。 AI ベンダーは、使用するデータセットとモデルのトレーニング方法も開示する必要があります。


スタンフォード大学の HAI の教授でコンピューター サイエンスの教授である Percy Liang 氏は、 Venture Beat との最近のインタビューで次のように述べています。したがって、この技術が倫理的および社会的に責任ある方法で開発および展開されるように、コミュニティとして今すぐ行動することが不可欠です。」

組織で基盤モデルの使用を開始するには何が必要ですか

過去 10 年間、企業による AI システムの実装を支援してきた ITRex チームは、人工知能の変化を目の当たりにしています。


単一のドメインで特定のタスクを実行するシステムは、より一般的に学習し、業界やユースケース全体で機能する広範な AI に取って代わられます。ラベル付けされていない大規模なデータセットでトレーニングされ、さまざまなアプリケーション向けに微調整された Foundation モデルが、この変革を推進しています。

あなたの会社が競合他社を飛び越え、AI システムからより早く ROI を得る準備ができている場合、基盤モデルを実装するための高レベルの戦略を以下に示します。


  1. データを収集して前処理します。最初のステップでは、基礎となる AI モデルにフィードするデータを収集して前処理します。このデータの品質と多様性は、微調整されたモデルが正確で堅牢であることを保証するために重要です。
  2. 基礎モデルを選択します。多くの事前トレーニング済みの AI 基盤モデルが市場で入手できます。一般的なソリューションには、BERT、GPT、ResNet などがあります。解決したいタスクと所有しているデータの種類に基づいて、適切な基盤モデルを選択することが重要です。
  3. ビジネス目標に合わせてモデルを微調整します。基盤モデルとデータの準備ができたら、モデルのパラメーターを特定のタスクに合わせて調整できます。この目標を達成するための 1 つの方法は転移学習です。この方法では、基礎モデルの事前トレーニング済みの重みを出発点として使用し、トレーニング データに基づいてそれらを調整します。
  4. モデルを評価します。微調整の後、モデルがうまく機能するかどうか、さらに調整が必要かどうかを判断することが重要です。基盤モデルのパフォーマンスを評価するには、精度、適合率、再現率、F1 スコアなどの標準的な指標を使用できます。
  5. AI ソリューションをデプロイします。微調整されたモデルのパフォーマンスに満足したら、それを運用環境にデプロイできます。 AI モデルを展開するためのいくつかのオプションには、クラウドベースのプラットフォーム、オンプレミス サーバー、またはエッジ デバイスが含まれます。


AI 基盤モデルを実装するには、技術的な専門知識と、専用のハードウェアおよびソフトウェア ツールへのアクセスが必要であることを覚えておくことが重要です。したがって、専門の AI ベンダーと提携するか、AI 専門家のチームに相談して、プロセスが効果的に行われるようにすることが役立つ場合があります。


AI のニーズについてご相談ください。貴社の AI 準備状況を評価し、データを監査してアルゴリズム分析用に準備し、人工知能を開始するための適切な基盤モデルを選択します!