現在、生成 AI の現状について多くの疑問が渦巻いています。企業はカスタムメイドの GenAI の取り組みをどの程度進めているのでしょうか? 組織は実際に独自のデータを使用して、効果的な方法で AI アプリケーションを構築しているのでしょうか? どのようなアーキテクチャが必要なのでしょうか? こうした疑問は驚くようなものではありません。AI については、恥ずかし気のない楽観論から冷めた皮肉まで、そして多くの誇大宣伝が混じった幅広い意見が世の中にはあるからです。 これは、市場が何を望んでいるか、何が起こるかに対する懸念、そして 2024 年に何が起こるか (そしてどのように起こるか) という 3 つの領域で GenAI 市場の状況を明確にするのに役立つことがわかりました。   誰もが何を望んでいるのか、そして何を恐れているのか?  GenAI は、OpenAI が ChatGPT をリリースし、この種のテクノロジーがいかに強力でアクセスしやすいかを示した 2022 年後半に爆発的に登場しました。AI の潜在的な利点に対する興奮はあらゆるところで高まりました。短期間で、GenAI はあらゆる企業のあらゆるアプリケーションに組み込まれることになります。投資家は、GenAI をサポートするインフラストラクチャを提供する企業にホッケースティックのような成長曲線を描くことを思い描いていました。 一方、反対派は「ウエストワールド」と「ブラックミラー」を合わせたようなディストピア的なAIの未来を思い描いている。AIバブルを 人もいる。投資の観点からは、暗号通貨が再び始まったようなものだと言う人もいる。つまり、大いに興奮し、大騒ぎになった後、煙が上がるクレーターが現れるのだ。 警告する 私は、これらの懸念はどちらも根拠がないと考えています。確かに、新しいテクノロジーの波が来るたびに、GenAI を間違った目的で利用する悪質な人物が現れます。そして、GenAI の可能性に対する興奮はどこにでもあります。それは確かに「弾ける」感じがあり、暗号通貨の話題よりも強烈かもしれません。 しかし、GenAI と暗号通貨の大きな違いは、前者には組織や業界を超えて数多くの実際の使用例があるという事実です。暗号通貨には、信頼できない当事者間の金融取引 (マネーロンダリングとも呼ばれます) という強力な使用例が 1 つありました。これは、主流の人々がそれほど関心を寄せていないものです。 現在、  。組織がそれを安全に行う方法を見つけるのに少し時間がかかりましたが、いったんそれがわかると、突然、誰もが電子商取引サイトを持つようになりました。 GenAI アプリケーションの状況は、企業がインターネット上でクレジットカードを安全に使用できるようにする方法を模索していた 1990 年代後半の電子商取引を思い出させます 私が現在 GenAI で見ている類似点は、言語モデルが によって不正確な応答を返さないようにする方法です。良いニュースは？それは解明されました (  (RAG) のおかげです。詳細は後述します)。 幻覚 検索拡張生成 私たちは今どこにいて、どこへ向かっているのでしょうか? 昨年私たちが目にしたものの多くは、概念実証の GenAI プロジェクト、つまり企業の経営陣に可能性を示すためのアプリでした。しかし、そこからさらに進んで、本格的な運用段階にあるアプリケーションを構築した企業はごくわずかです。ここで言う「運用段階」とは、組織が AI アプリケーションを所有し、それがプロトタイプではなく顧客や従業員によって使用されていることを意味します。 言い換えれば、ビジネス運営のいくつかのセグメント内の活動の日常的な一部として利用できます。フロント オフィスであったり、カスタマー サービスへの電話の背後であったりするかもしれませんが、ビジネスの主流に近い部分です。 ウォルマートは、その好例です。この小売業者は 。Apple は、従業員がより迅速に技術サポートを提供できるように GenAI ツールをテストしている 。このような例がさらに増えるまで、GenAI は、ガートナーが「 」と呼ぶ初期段階にもう少し長く留まることになります。 、1 月にショッピング アプリに GenAI を利用した検索機能を追加したことを発表しました と報じられています 誇大宣伝サイクル フォルクスワーゲンは、自動車のナビゲーションおよびインフォテインメントアプリケーション用の GenAI アプリを開発するための社内ラボを発表した。   とはいえ、一部の人が考えるほど「生産性のプラトー」に到達するのはそう遠くありません。先ほど述べたように、モデルの出力を信頼することは、幻覚を減らして関連性と正確性を備えた (LLM) 応答を生成する方法に取り組んでいる組織にとって、障害となっています。 大規模言語モデル  RAG は、他のソース (ほとんどの場合、ベクトルを保存できるデータベース) からの追加データやコンテキストをリアルタイムでモデルに提供し、現在この問題を解決するために使用されています。この技術の進歩は、組織の最も貴重な資産である独自のデータに基づいて構築された、ドメイン固有のカスタム GenAI アプリケーションを開発するための鍵となります。  RAG は、企業のコンテキストを GenAI アプリケーションに取り込むための事実上の方法として登場しましたが、事前トレーニング済みのモデルをデータのサブセットでさらにトレーニングする微調整についても言及されることがよく が、プライバシー、セキュリティ、または速度に懸念がある場合は、RAG が適切な選択です。 あります。この方法が役立つ場合もあります アプリケーションにコンテキストがどのように追加されるかに関係なく、私が話をしてきた投資家からよく受ける大きな質問は、企業が GenAI アプリから収益を上げ始めるのはいつになるのかということです。 私の回答: あなたが追跡している企業のほとんどは消費ベースのビジネスです。現在、多くの企業が顧客が構築した実験、概念実証 (POC)、ニッチなアプリをサポートしていますが、これらは消費にはあまり貢献していません。 しかし、主要な AI アプリケーションが POC から実際の運用段階に移行し始めるにつれて、状況は変わり始めています。これは 2024 年末までに大きく進展すると予測しています。2024 年後半には 2 つの場所で実現するでしょう。 まず、小売業で定着しつつあります (前述の Walmart の例を参照)。また、PDF によるチャット、ナレッジ ベース、社内コール センターなど、私が「AI イントラネット」と呼んでいる分野でも、AI の導入が広まっています。 こうした種類のアプリが促進する消費により、 、 、さらには などの企業も AI の 始めている。ハイパースケーラーの領域以外では、他の AI インフラ企業も来年 1 月、2 月、3 月に発表する収益報告書で AI の伸びを強調し始める可能性が高い。 マイクロソフト グーグル オラクル 成果を報告し  GenAI アプリケーションの実稼働への道 消費ベースの AI インフラストラクチャ企業のための基盤はすでに整っています。ドメイン固有の特注アプリケーションの大規模な基盤で何ができるかを示す強力な商業的証拠がすでにあります。クリエイティブ AI アプリ (Midjourney、Adobe Firefly、その他の画像ジェネレーターなど) から、GitHub Copilot (  )、Glean などのナレッジ アプリまで、これらのアプリケーションは広く採用され、生産性の大幅な向上につながっています。 100 万人を超える開発者が使用 特注アプリの進歩は、知識をインタラクションのポイントに届けることを容易にする必要がある業界やユースケースで最も進んでいます。知識は、既製のモデル (オープンソースまたは独自のもの)、RAG、および選択したクラウド プロバイダーを使用して、独自のデータから得られます。 企業が本番規模での機能の厳しさに対応できるカスタム GenAI アプリを構築するには、スマート コンテキスト、関連性、スケーラビリティという 3 つの要素が必要です。 スマートコンテキスト GenAI アプリケーションで独自のデータを使用して有用で関連性が高く正確な応答を生成する方法を簡単に見てみましょう。 アプリケーションは、あらゆる種類のデータの形でユーザー入力を受け取り、それをすべて埋め込みエンジンに送り込みます。埋め込みエンジンは基本的にデータから意味を導き出し、RAG を使用してベクター データベースから情報を取得し、LLM が使用できる「スマート コンテキスト」を構築します。この「スマート コンテキスト」を使用して、ユーザーにリアルタイムで提示される、コンテキスト化された幻覚のない応答を生成します。 関連性 これは、運用データベース企業ではあまり耳にすることのない話題です。しかし、AI とベクター データベースの分野では、関連性は再現率と精度の組み合わせであり、有用で正確で幻覚的でない応答を生成するために非常に重要です。 従来のデータベース操作とは異なり、ベクター データベースでは、本質的に非決定論的なセマンティック検索または類似検索が可能です。このため、同じクエリに対して返される結果は、コンテキストや検索プロセスの実行方法によって異なる場合があります。ここで、ベクター データベースが実際のアプリケーションでどのように動作するかにおいて、正確性と関連性が重要な役割を果たします。自然なインタラクションには、類似検索で返される結果が正確であり、要求されたクエリに関連していることが必要です。 スケーラビリティ POC を超えて本番環境に移行する GenAI アプリには、高いスループットが必要です。スループットとは、基本的に、一定時間内に保存、アクセス、または取得できるデータの量です。高いスループットは、リアルタイムでインタラクティブなデータ集約型の機能を大規模に提供する上で重要です。書き込みには、複数のソースからの数十億のベクトルが関係することが多く、GenAI アプリケーションは 1 秒あたり膨大な量のリクエストを生成する可能性があります。 まとめ これまでの技術革新の波と同様に、GenAI は確立されたパターンに従っており、すべての兆候は、以前の技術革命よりもさらに速く進んでいることを示しています。否定的および肯定的な誇大宣伝をすべて排除すると、POC GenAI アプリを本番環境に移行しようとしている企業によって有望な進歩が遂げられていることは明らかです。 そして、私の勤務先である DataStax のように、これらのアプリにスケーラブルで構築しやすい基盤を提供する企業は、一部の人が考えるよりも早く、顧客の消費によるメリットを実感し始めるでしょう。 エド・アナフ、DataStax   かについて、詳細をご覧ください。 DataStax がどのようにして顧客の GenAI アプリを本番環境に導入できるようにする

DataStax Astra DB is the vector database for getting GenAI apps into production, fast. Try it for free today!

DataStax

このオーディオは、ストーリーの元の言語で制作されています。

インフラ企業はいつジェネレーティブ AI から利益を得られるのでしょうか?

About Author

コメント

ラベル

この記事は

Related Stories

HackerNoon ライティングコンテストで優勝したいですか? #crypto-api コンテスト優勝者のおすすめはこちら

タップして稼ぐ：テレグラムはソラナより先に次の100億人の暗号通貨ユーザーを獲得する可能性がある

Claude Sonnet 3.5 システムプロンプトの漏洩: 法医学的分析

ワークフローを10倍に向上させる方法: 必須アプリ17選

HackerNoon ライティングコンテストで優勝したいですか? #crypto-api コンテスト優勝者のおすすめはこちら

タップして稼ぐ：テレグラムはソラナより先に次の100億人の暗号通貨ユーザーを獲得する可能性がある

Claude Sonnet 3.5 システムプロンプトの漏洩: 法医学的分析

ワークフローを10倍に向上させる方法: 必須アプリ17選

Light-Mode

Classic

Newspaper

Minty

Dark-Mode

Neon Noir

Minty

HN StartUps