ただし、生成 AI コンサルティングの専門知識を活用して、Gen AI サービスの価格設定を調査し、Gen AI プロジェクトのコストの背後にある重要な要因を列挙することはできます。このようにして、情報に基づいた意思決定を行うための知識を提供し、この急速に進化するテクノロジー環境においてビジネスの時間とリソースを大幅に節約できる可能性があります。
生成 AI ソリューションの中心には、基礎モデル、つまり膨大な量のデータでトレーニングされた大規模なモデルがあります。基本的に、基盤モデルは、オーダーメイドの Gen AI ソリューションを作成し、開発プロセスを簡素化し、AI の生成コストを削減するための基礎として機能します。通常、その機能には、自然言語処理 (NLP)、コンピューター ビジョン (CV)、コンテンツ生成が含まれます。
あなたの会社は、効果的であり、生成 AI のコストに関する期待を満たす基盤モデルをどのように選択できますか?
既存のすべての生成 AI モデルは、大まかに 2 つのタイプに分類できます。
クローズドソース モデルは、 Google、Meta、Microsoft、OpenAI などの大手テクノロジー企業によって開発されています。それらのソース コード、アーキテクチャ、およびアプリケーション プログラミング インターフェイス (API) は、完全に独自のものにすることも、サードパーティが利用できるようにすることもできます (通常は有料で、基本的に生成 AI ソリューションの費用となります)。場合によっては、データを使用してクローズドソース モデルのパフォーマンスを微調整できます。この記事では、クローズドソース モデルを市販の生成 AI ソリューションと呼びます。このようなモデルの主な利点は、クラウド インフラストラクチャが付属しており、元の開発者によって完全に保守されていることです。
オープンソース モデルには、ソース コード、トレーニング手法、さらにはトレーニング データさえも公開されており、公開して変更することができます。企業は、そのようなモデルを「そのまま」使用することも、独自のデータで再トレーニングして、より優れた精度とパフォーマンスを達成することもできます。ただし、モデルを実行するにはオンプレミスまたはクラウドのインフラストラクチャをセットアップする必要があります。したがって、このような生成 AI モデルのコストには、コンピューティング コストと、Gen AI ソリューションの強化を選択した場合はモデルのトレーニングに関連する費用が含まれます。
カスタマイズせずにクローズドソース モデルを使用する。生成 AI のパイオニアは、API を使用して、OpenAI の ChatGPT、Google Bard、Claude、Synthesia などの既製製品を自社のアプリケーションと統合できます。統合プロセスは非常に簡単で、生成 AI の価格設定も同様です (詳細は後ほど)。市販の製品は頻繁に更新され、AI 開発者向けに広範なドキュメントを提供します。欠点は?カスタマイズのオプションは限られており、カスタマー サポートの問い合わせの処理やビジュアル コンテンツの作成など、重要なビジネス タスクについては外部企業に大きく依存することになります。
企業データに関する市販のソリューションを再トレーニングします。このシナリオでは、社内の AI チームが、OpenAI などの特定のベンダーによって開発された既存の生成 AI 製品を選択し、独自のデータを使用して微調整します。カスタマイズされた Gen AI ソリューションは、ユーザーの質問をより深く理解し、より正確な回答を導き出します。ただし、ベンダーはクエリの実行に対して少額の料金を請求するため、最終的な生成 AI コストは運用コストとカスタマイズコストの両方で構成されます。
オープンソースの基盤モデルを「そのまま」使用する。大げさに言えば、企業は RoBERTa、GPT-2、GPT-Neo、またはその他のオープンソース モデルを選択し、追加のトレーニングなしで顧客のメールに返信するなどのビジネス タスクに適用できます。ただし、生成 AI のコストは、モデルが消費するコンピューティング リソースによって決まります。また、馴染みのないデータやタスクに直面すると、Gen AI ソリューションのパフォーマンスが低下する可能性があります。
データに基づいてオープンソース モデルを再トレーニングします。この場合、Gen AI モデル トレーニング用の特定のデータを取得して準備し、モデルのトレーニングと操作用にオンプレミスまたはクラウド サーバーを提供し、タスクの進化に応じてモデルの微調整と更新を続ける必要があります。このオーダーメイドのアプローチでは優れたモデルのパフォーマンスが保証されますが、AI の生成コストも高くなります。
キャラクターベースの課金。 Google の Vertex AI によって駆動される Gen AI ツールなどの一部のソリューションは、入力テキストと出力テキストの文字数に基づいてユーザーに料金を請求します。各文字、数字、スペース、句読点は 1 文字としてカウントされます。たとえば、Vertex がサポートする PaLM 2 for Text モデルの生成 AI の価格は、入力テキストと出力テキストの 1,000 文字あたり 0.0005 ドルから始まります (別途請求)。
生成 AI プロバイダーが異なれば、文字とトークンの概念も異なることに注意してください。最もコスト効率の高いオプションを選択するには、そのドキュメントと計画を検討し、どの製品が独自のビジネス ニーズに最も適しているかを検討する必要があります。たとえば、タスクが分析ではなくテキスト生成を中心に展開している場合は、出力レートが低い生成 AI サービスの方が適しています。
一方、ビジュアルコンテンツ作成用の Gen AI サービスは、生成された画像ごとにユーザーに料金を請求する傾向があり、料金は画像のサイズと品質に関連付けられています。 DALL・E 3 で標準品質で作成された 1024 x 1024 ピクセルの画像 1 枚の料金は 0.04 ドルです。より大きな画像 (1024×1792 ピクセル) や高解像度画像の場合、価格は 1 枚あたり 0.08 ~ 0.12 ドルになります。
また、Synthesia.io などのターンキー Gen AI プラットフォームも忘れてはなりません。これらのプラットフォームは、より伝統的な価格設定アプローチを採用しています。マーケティング チームがビデオ作成プロセスのスピードアップを目指している場合は、年間わずか 804 ドルでこのツールを試すことができます。
市販の Gen AI 製品のカスタマイズにかかるコスト
前のセクションからわかるように、既製の Gen AI 製品の大部分は従量課金制の収益化戦略を活用しています。
料金モデルは一見すると非常に単純そうに見えますが、特にさまざまな部門で複数の生成 AI のユースケースを調査しようとしている場合、従業員が実行するクエリの数を予測するのは難しい場合があります。
これは、クラウド コンピューティングの初期の頃と同様、Gen AI ツールの価格設定と総所有コストに関する混乱を引き起こします。
商用 Gen AI ソリューションを使用するもう 1 つの欠点は、ChatGPT のような汎用製品には、企業の構造、製品、サービスに関する知識などのコンテキストに関する知識が不足していることです。そのため、プロンプト エンジニアリングをマスターしたとしても、カスタマー サポートやレポート生成などの業務を AI 機能で強化することが困難になります。
マッキンゼーのシニアパートナー、エリック・ラマール氏によると、この問題を解決するには、組織は「モデルで利用できるデータ環境を構築する必要がある」という。言い換えれば、企業データや API を介して外部ソースから取得した情報に基づいて、市販の Gen AI ツールを再トレーニングする必要があります。
目標を達成するには 2 つの方法があり、各シナリオで生成 AI のコストに影響を与えるいくつかの要因があります。
生成 AI 機能を備えた Software-as-a-Service (SaaS) プラットフォームの使用。 SAP、TIBCO Spotfire、Salesforce などの多くの著名な SaaS ベンダーが、顧客データを使用して微調整できる生成 AI サービスを展開しています。たとえば、Salesforce は、Salesforce Data Cloud から独自のデータを取得して顧客の質問に対するパーソナライズされた応答を作成する会話型 AI アシスタントである Einstein Copilot を発売しました。インテリジェント アシスタントによって利用される情報には、Slack の会話、テレメトリ、エンタープライズ コンテンツ、その他の構造化データおよび非構造化データが含まれます。 Salesforce クライアントは、Einstein Copilot Studio のコード不要のプロンプトビルダーとモデルビルダーを使用して、カスタム AI モデル、スキル、プロンプトを作成することもできます。現時点では、後者のツールは OpenAI の大規模言語モデル (LLM)をサポートしていますが、この製品を Amazon Bedrock や Vertex AI などの他のサードパーティ ソリューションと統合する計画があります。 Einstein Copilot はまだパイロット段階にあるため (冗談ではありません)、生成 AI の価格情報はまだ公開されていません。ただし、生成 AI Sales GPT アシスタントのコスト (現在、ユーザーあたり月額合計 50 ドル) を見れば、何が予想されるのかの大まかなアイデアが得られるでしょう。
API を介して企業ソフトウェアを Gen AI ソリューションと統合し、データに基づいてモデルを再トレーニングします。生成 AI の実装コストを削減するには、中間の SaaS ツールを排除し、アプリを API レベルで商用の Gen AI ソリューションと直接結合することができます。たとえば、Gen AI 機能でカスタマー サポート チャットボットを強化したい場合は、OpenAI API を使用して OpenAI のモデルの 1 つ (GPT-3.5 や GPT-4 など) と同期できます。次に、機械学習用にデータを準備し、そのデータを OpenAI にアップロードし、OpenAI CLI ツールと Open AI Python ライブラリを使用して微調整プロセスを管理する必要があります。モデルを微調整している間は、1,000 トークンあたり 0,008 ドルが請求されます (GPT-3.5)。モデルが実稼働に入ると、入力レートと出力レートはそれぞれ、1,000 トークンあたり $0,003 と 1,000 トークンあたり $0,006 になります。 OpenAI サーバーでデータをホストすることを選択した場合、生成 AI の全体コストにはストレージ コストも含まれます。データ ストレージ費用により、1 日あたり 1 GB のデータあたり 0.2 ドルが最終見積もりに追加される可能性があります。データの準備とモデルの微調整の取り組みも忘れないでください。 IT 部門が必要なスキルを持っていない限り、信頼できるAI 開発サービス会社と提携する必要があります。
データの準備。基礎モデルを微調整するためにデータを収集、クリーニング、準備するプロセスは、リソースを大量に消費する可能性があります。したがって、生成 AI の実装コストには、データの保存、処理に関連する費用が含まれ、企業に独自のデータがない場合、またはセキュリティやプライバシー上の理由でデータセットを使用できない場合にはトレーニング データセットの購入にかかる費用も含まれます。
Gen AI ソリューションは本質的にブラックボックスであるため、特定の結果が得られる理由やその精度を評価する方法が明確になることはほとんどありません。この理解の欠如により、開発者がモデルを微調整することができなくなる可能性があります。生成 AI モデルのトレーニング中に、モデルの解釈可能性テクニック、注意メカニズム、監査証跡の導入など、説明可能な AI原則に従うことで、モデルの意思決定プロセスについて洞察を得ることができ、そのパフォーマンスを最適化できます。
また、生成 AI の実装を開始する前に、企業が回答する必要のある質問がいくつかあります。
ベンダー ロックインを防ぎながらテクノロジーが差別化要因となる機能にのみ生成 AI を採用していることを検証するための、確実な購入対構築戦略は確立されていますか?この戦略は、変更管理と Gen AI スケーリングのための詳細なロードマップと、必要に応じてビジネス プロセス全体を再設計するための規定によって強化される必要があります。
社内の IT 部門は、複雑な ML モデルとそのトレーニング データの品質をテスト、微調整、維持するための適切な MLOps スキルを持っていますか?そうでない場合は、これらのタスクを引き受ける信頼できる AI 開発会社をすでに選択していますか?
クラウドとエッジの両方に大量のコンピューティング リソースがありますか?また、IT インフラストラクチャのスケーラビリティと、さまざまなタスク、プロセス、ユニット間で Gen AI モデルを再利用できるかどうかを評価することも重要です。
あなたの会社または AI 開発パートナーは、概念実証 (PoC)を通じて Gen AI の実現可能性をテストし、制御されたサンドボックス環境の外で実験を拡張するスキルを持っていますか?