2022 年 11 月 30 日に OpenAI によって開始された ChatGPT は、史上最も急速に成長しているテクノロジ プラットフォームとしてすでに 100 万人のユーザーを獲得しており、エンジニア、言語学者、マーケター、学生の想像力を魅了する次のレベルの生成 AI でインターネットに火をつけています。 、 もっと。
ChatGPT は、大規模言語モデル (LLM) GPT-3.5 から生まれた、世界で最も高度な汎用チャットボットです。これは、2022 年 1 月に稼働し、会話型 AI スペースで同様の小さな波を起こした InstructGPT の反復を表しています。 GPT-3.5 は GPT-3 モデルのバリエーションであり、2021 年後半に、選択された抜粋とコードの幅広い調合で 1,750 億のパラメーターに合わせてトレーニングされます。これまでの結果は、印象的ではありませんでした。
ChatGPT は、シェイクスピアの力を利用してソネットを書くことができます。
これは、ライターのブロックに対する AI のレッキング ボールであり、並外れた新しい検索エンジンであると宣伝されています。コンテンツを生成する ChatGPT の目を見張るような能力と、会話全体で展開されるコンテキストの保持が他に類を見ないことは間違いありません。しかし、消費者向けのユースケースは明らかですが、企業や B2B または B2B2C の実世界での実装に関連する OpenAI の最新の驚異には、まだ多くの要望が残されています。
ChatGPT (および/またはその他の LLM ベースのチャットボット) は、料理全体ではなく、レシピの主要な要素の 1 つです。自然言語理解 (NLU) の障壁は確実に取り払われていますが、ChatGPT の会話力は限界に達しています。統計的に正確であるだけでは十分ではありません。ヘルスケアや政府などの機密性の高い業界では、正確に近いものはエンタープライズ実装の開始点にはなりません。
レシピの残りの半分は、ビジネス ユース ケース向けであり、ユーザーをナビゲートしながら精度を確保するために、専門的な組織の知識 (独自のデータ) へのリアルタイム アクセスを動的なビジネス ロジック (刻々と変化する内部および外部プロセス) と一致させます。彼らの目標を達成するために。ミックスに追加の重要な要素がなければ、ChatGPT やその他の LLM ベースのチャットボットを使用することはできません.
入力: 既存の会話型 AI 企業。
ミシュランの星を獲得したシェフは自分でトマトを栽培していませんが、最高のトマトを見つける方法を知っています。これは、ほとんどの会話型 AI ソリューションが STT (Speech-to-Text) や TTS (Text) を使用して車輪を再発明しないのと同様です。 -to-Speech) を使用する代わりに、Google または Microsoft から既に存在する最強のものを調達することを選択するのと同様に、会話型 AI 企業も、現在世界でトップの大規模な言語モデルである GPT-3.5 を会話型スタック内に組み込む予定です。
顧客のためにセキュリティと精度を優先しながら、これをシームレスに行う企業は、生成型および会話型 AI の新時代の勝者として浮上するでしょう。ここで、企業にとって真の魔法が起こります。
現在の会話型 AI ソリューションと ChatGPT の共存がどのように見えるかを見てみましょう。まず、導入を成功させるためにビジネス グレードの会話型 AI が必要とするものについて説明します。企業やその他の「情報を重視する」組織にとって実行可能であるためには、会話型 AI は 5 つの重要なボックスにチェックを入れる必要があります。
リアルタイムのカスタム ナレッジ — 医師との面談のスケジュール設定や技術的な製品情報の検索など、データ主導の意思決定を行うために、ユーザーは、通常 API を介して取得される、即座に更新された正確なビジネスおよび製品情報を要求します。これらのデータセットとビジネス ルールは、本質的に個々の組織に固有のものであり、ChatGPT が効果的に行う「常識的な」知識の理解を超えて、それらの動的なオントロジーは理想的にはナレッジ グラフに吸収される必要があります。 ChatGPT の場合、そのドメイン固有の情報、さらには組織固有の情報へのアクセスは存在しません。それが提供できる情報は、前述のように、2021 年のパラメーターでトレーニングされた大規模な言語モデルに基づいており、多くの場合、せいぜい無関係なデータ。組織のナレッジ ベースの自動更新は、デジタル サービスを分刻みで提供するために必要なスキルであり、エンタープライズ向けの会話型 AI 企業はごくわずかです。
展開の範囲内で顧客サービスのユースケースとパーソナライゼーションを優先している組織の場合、欠落している知識の別のレイヤーが追加されます。一般的なデータは、進行中の会話コンテキストとログに記録された個々の顧客の好みの両方と簡単に統合する必要があります。セールスフォースのような CRM。 LLM の一般的で古い情報のみを使用する場合、これは十分に文書化された障害です。動作中の AI アシスタントは、新しいデータ ポイントや進化するシナリオに遭遇したときに学習したり、再トレーニングしたりすることができないからです。
説明可能性 — 2021 年にさかのぼって、私たちは GPT-3 を取り上げました。ほとんどのニューラル ネットワークと同様に、GPT-3 は実際の会話出力の背後にある理由を理解するのが難しいブラック ボックスを表していました。 ChatGPT のベースとなっている GPT-3.5 には、同様に可視性の欠如があります。確かに、ChatGPT を構築する人間は入力 (取り込まれたデータ) を制御し、生成される出力を確認できますが、残念ながら、さまざまな変数とパラメーターを組み合わせてそれらの出力を作成する方法を理解することはできません。
ChatGPT とそのベースとなっている LLM は、多数の複雑な質問に正しく答えることができるため、当然のことながら印象的ですが、古いデータと、偏った回答を提供するようにだまされる能力のために、大量の不正確な回答が生成されます。アシスタントが失敗した場合、説明責任はありません。手元にある問題をデバッグしたり、不正確な出力の原因を追跡したり特定したりする方法はありません。簡単に言うと、ChatGPT は自分が何を知らないのかを知りません。さらに、ユーザーが提案した推定に異議を唱えることはできません。
企業がナレッジ グラフ テクノロジを検討し始めた主な理由の 1 つは、データの透明性と説明可能性の欠如を回避することです。反復や修正ができないユーザー向けインターフェースは、ビジネス環境で持続可能でないか、拡張可能ではありません。特に、これらの業界が非常に機密性が高いと見なされている場合はそうです。
これは、既存の会話型 AI ソリューションが LLM よりも優れているもう 1 つの側面です。最下層の DIY チャットボットでさえ、ユーザーは必要に応じて会話の流れを変更および改善できます。より洗練された会話型 AI インターフェイスの場合、ユーザーはエラーの明確なスナップショットを取得できるだけでなく、問題を追跡、診断、修正することができます。
セキュリティと予測可能性 – 特に、ヘルスケア、政府、銀行などのデータに敏感な業界では、一般的で生成的な応答が、現時点では認識されていない責任とリスクをもたらします。ヘルスケアにおける EMR (電子カルテ) のような非常に機密性の高いデータを取り込むと、企業に対する顧客の信頼が損なわれ、ソリューション全体の有効性が疑問視される結果になる可能性があります。
以下の簡単な数学の例を見てみましょう。 2は自然数で整数ですよね? ChatGPTに別の考え方をするように偏らせている場合はそうではありません:
この例は、次のことを示しています。
今では、症状のチェックや患者ポータルのクエリなど、偶然に任せることができない、はるかに複雑で機密性の高いユース ケースを採用しています。現在、既存の会話型 AI プラットフォームに事前に組み込まれているプロトコルによって保護されていない限り、スタンドアロン ソリューションとしての ChatGPT が HIPAA コンプライアンスの対象となる個人を特定できる情報 (PII) を含むセキュリティ保証とユース ケースが実現されるのは何年も先のことです。
当初はウェブサイト経由のチャットからコール センター経由の音声通話へと拡大していましたが、長さを最適化し、コンテキストを追加し、目標達成までの時間、つまり価値実現までの時間を最大限に短縮するために、大幅な変更を行う必要がありました。調整しないとどうなるかの例を次に示します。
テキスト的には長くないように見えるかもしれませんが、上記のスニペットは、純粋な AI 音声生成に変換すると、実際には 45 秒のモノローグになります。これは、コール センターでの UX としては不十分であり、業界が移行しようとしているピンポンのような人間中心の会話型 AI とはかけ離れています。
たとえば、患者が医師の診察の予約を依頼した場合、次の手順を実行せずに、予約が存在することだけを伝えることは、標準以下のエクスペリエンスとなります。トップ パフォーマンスの企業の消費者が真に必要としており、現在期待しているのは、目標をエンド ツー エンドで完了するために取られる積極的な行動です。つまり、複数のデータベースや API の更新を含む可能性のある医師の予約を取りに行きます。
統合、特に垂直固有のものは、複雑なアクションを考慮するとますます重要になります。統合がなければ、ChatGPT は企業レベルで真の自動化を実行できません。
コンテキストの弾力性 - ChatGPT の能力は、特に発話の長いシーケンスでコンテキストを維持し、全体を通して人間のような会話を保持するという並外れた成果です。
典型的なシャボットと音声アシスタントは、会話の流れと事前定義されたインテントの硬直性のために壊れることが知られています。 ChatGPT を使用すると、会話中にコンテキストが失われることはありません。つまり、自然にヒューマン エラーが発生しやすい顧客は、方向転換、入力内容の変更、言い直しなどをスムーズに行うことができます。コンテキストを組み込み、会話の前の部分を参照することは、顧客体験の向上だけでなく、従業員のユースケースに対するスキルアップ支援にも役立ちます。
データの優位性 – ChatGPT は、非シンボリストにとって大きな前進です (以下を参照)。
たとえば、海の写真を十分に見ると、AI は自信を持って海が青いと推測できます。膨大な量のデータにより、企業は、機械学習 (ML) を介して独自のモデルをトレーニングするという時間とコストのかかるプロセスを忘れることができ、独自のトレーニング データの制限の境界を超えることができます。象徴主義者(以下を参照:
ChatGPT の要素を組み合わせて会話体験を改善すると同時に、エンタープライズ データで実行される、より制御されたセキュリティ重視のエンジンを選択することが、会話型および生成型 AI の次の波に突入する際の最終的な道となります。最新の専門知識を世界で最も強力な大規模言語モデルとシームレスに組み合わせることができれば、会話型自動化の可能性は無限に広がります。
ここにも掲載されています。