1,031 測定値

自律型エージェントと次の経営革命

に Archie Whitford17m2023/06/21

長すぎる; 読むには

自律的なエージェントは、一人の人間が自分自身に対してできることに革命をもたらすでしょう。この記事では、エージェントがスタッフを配置する初の 1 人体制のユニコーンの前例として、取り組むべき重要なインフラストラクチャの機会をいくつか特定します。 * エージェントのリソース割り当てに対するインセンティブメカニズム * 機能的な「従業員」エージェントのマーケットプレイス * ユニバーサルタスクコーディネーター ※IoTオペレーターとしてのエージェント * 人間とエージェントのレプリカ * センサーおよびその他のアクチュエーター用のエージェント固有のネットワーク * エージェントの標準化と相互運用性プロトコル * 高度なアプリケーション向けのエージェントテストネット * 機械倫理に関する公開投票メカニズム

一体、自律エージェントとは何でしょうか？

あなたが AI 分野に直接取り組んでいない場合、自律エージェントの概念を知るきっかけとなったのは、次のようなインフルエンサーの芽生えによるものである可能性があります。

「🤯 ChatGPT 上に移動…」

「これまで聞いたことのないツールにより、私たちは AGI に一歩近づきます 🤖」

「今AIがやっていることなんて信じられないでしょう!!」 💪」

エンゲージメントスレッドはさておき、自律型エージェントは 2023 年 3 月のローンチ時に主流の牽引力を大きく蓄積し始めました。 AutoGPT 。 AutoGPT は当初、ChatGPT の拡張バージョンとして起動され、次の機能を備えていました。タスクの割り当て、インターネットの閲覧、長期および短期メモリの両方の保存、ローカルファイルの要約、および (運が良ければ) 設定されたタスクの実行後に、ユーザーが包括的な目標を初期化しました。

AutoGPT は、一般的な自律エージェントとして説明できるものの最初のインスタンスを表しました。複雑さを避けるために、この記事の残りの部分では、「自律エージェント」の定義を、次のような人間以外のエンティティであると仮定します。

独自のタスクを割り当てる機能がある
目的関数を提供すると、ユーザー入力とは独立して動作可能 (例: 今年のニュースレター購読者を 10,000 人増やす)
訓練された内容を超えた新しい情報を検索する能力がある
長期記憶と短期記憶の両方の能力がある

これらの機能はすべて、AutoGPT 内にある程度存在していました。ただし、今後エージェントを ChatGPT スタイルのチャットボットから分離するさまざまな追加機能が他にもあります。これらには次のようなものが含まれます。

個人ツールの使用またはアクセス(電子メール、クレジットカード、CRM、ソーシャルメディアなど)
他の自律エージェントと独立して通信、調整、共同作業してタスクを完了できる

エージェントがこれらのタスクをどのように初期化し、優先順位を付け、実行するかについてのいくつかの例を実際に理解するには、次のことをお勧めします。マット・シュリヒトの入門書エージェントについて。

「従業員」としてのエージェント: 自律エージェントを理解するための簡単なヒューリスティック

メディアの議論では「AIが人間の仕事を奪う」ということが多く取り上げられてきた。

AI が関与する経済活動における人間の役割の増大についての議論には、比較的ほとんど費やされていない。

狭い範囲の人工知能（つまり、専用のエージェント）が法律、会計、家庭教師などの日常的な意思決定の仕事を占めるようになるにつれて起こる重要なパラダイムシフトは、人間が失業することではありません。大きな変化は、すべての人間がマネージャーになる機会を持つことです。

今日会社を設立することになったとします。たとえば、地味で好奇心旺盛な人向けのソーシャルメディアプラットフォームを始めるつもりです。以前は、このプラットフォームのアルファ版が十分な注目を集めた場合、プラットフォームの拡大を支援するために、私はさまざまな役割を雇わざるを得なくなりました。プロダクトマネージャーはユーザーと対話してユーザーが望むものを定義し、エンジニアはユーザーの要望を作成します。ユーザーのニーズを満たすコード、より多くのユーザーの手に製品を届けるためのマーケティング担当者、業務全体が準拠していることを確認する法律顧問などです。

「従業員テスト」に合格した有能なエージェントが存在する世界 (つまり、特定の役割のエージェントの出力は、外部の観察者には人間の出力と同じに見える) では、この操作全体を単独で実行することも可能です。

それでは、私たち全員がこれらの複雑な組織のマネージャーになろうとしている場合、それを効果的、安全、そして収益を上げるためにはどのようなツールを導入する必要があるのでしょうか?

現在の自律型エージェントスペース: 利点と問題点

よくある問題

ここ数か月で AI は大きく進歩しました。しかし、まだまだ先はたくさんあります。

今これらのツールを試してみると、「従業員テスト」を満たすのを妨げる多くの欠点に気づくでしょう。

パーソナライゼーション

まず、これらのエージェントによって生成される文書出力の多くは、「音声」に創造性や独創性が欠けている傾向があります。エージェントが法的文書を作成したり、新製品の市場分析を作成したりすることを目的としている場合、これはあまり重要ではありません。ただし、それらがブランド構築タスクに使用されるか、または人間の「マネージャー」の評判を高めるために使用されるかどうかは、非常に重要です。

このパーソナライゼーションのハードルを克服するには、エージェントはマネージャーの意図する声を理解する必要があります。これを達成する最善の方法は、マネージャのパブリック (ブログ投稿など) とプライベート (電子メールなど) の両方の出力についてエージェントをトレーニングすることです。ここでの大きな障壁となるのは、エージェントがこのデータに対して責任を持って行動するという信頼です。この信頼を確保するにはどのようなメカニズムを導入する必要がありますか?

信頼性

おそらく、この第 1 世代の自律エージェントの最もよく指摘されている欠点は、幻覚を見る傾向があることです。

初心者のために説明すると、人工知能の文脈における幻覚とは、自信を持って間違った答えを主張する機械の傾向を指します。現世代のエージェントの場合、これはループに陥る傾向と残念な一致を形成し、出力に向かって進むのではなく前のタスクに戻り続けます。

エージェントが主流の視聴者の間で妥当なレベルのユビキタス性を達成するには (ましてや仕事のコンテキストで自分のデバイスに任せる必要はありません)、人間のエージェントの能力に匹敵し、最終的にはそれを超える信頼性のレベルを達成する必要があります。仕事を終わらせ、仕事の事実を確認するためです。実際の幻覚の副作用の例については、以下を参照してください。スティーブン・シュワルツの最近の例、ニューヨークの弁護士は、ChatGPTが実際の事件の準備書面で実際の事件として自信を持って主張した先例を虚偽に使用しました。

この領域における機会に関して言えば、最初の機会は明らかです。幻覚を起こさないエージェントを作成します。ただし、第 2 に、i) エージェントの信頼性テスト、ii) 敵対的な攻撃に対してこれらのエージェントプロトコルを厳密にストレステストできる製品の市場と需要のための暫定的な市場が存在します。これらの概念は、広く普及するために必要な信頼性とセキュリティのレベルを達成するエージェントを設計するのに役立ちます。

パーソナライゼーション

現状では、あなたと私が同じプロンプトを同時に ChatGPT に入力した場合、同じ出力が得られます。これは、さまざまな理由から、AI ユーティリティにとって非常に制限的な機能です。まず、与えられたプロンプトに対する普遍的な答えは、AI 分野の中央集権的なリーダーを人間の知識と成果の一枚岩に変えるでしょう。誰もが仕事や遊びでますます高度なツールに依存するようになると、優勝モデルがトレーニングされたものによって決まる統一基準にすべてが向かう傾向になります。これが心配に聞こえるのであれば、それは実際にそうなっているからです。

さらに重要なのは、物事が退屈になってしまうということです。客観的ではない問題や、特定のスタイルで実行する必要があるタスクの場合、エージェントがユーザーの理解をある程度活用して、ユーザーの議論や出力を調整することは当然のことです。これは、彼らが私たちに代わって行動することを私たちが安心して許可できる未来にとって極めて重要です。

エージェントが存在する前の私たちを忠実に表現するかどうかを検証する必要があります。

安全

機械があなたの代わりにあなたの機密データを操作し、場合によっては話したり入力したりするあなたのレプリカとして動作するという考えは、最も進歩的な技術者にとってさえ脅威に聞こえます。エージェントにエンタープライズレベルのデータへのアクセスを許可することは、まったく別のワームの缶詰です。

では、i) 個人が自分の代わりに行動してくれるエージェントを信頼でき、ii) 企業が自社の情報と活動が攻撃、悪用、悪用から安全であることを完全に保証できる限り、セキュリティとプライバシーのリスクをどのように軽減できるでしょうか?

いくつかのプライバシーメカニズムは現在すでに導入されており、あなたが思っているよりも基本的なものである可能性があります。プライベートエージェントの使用においては、2 要素認証が重要になります。アクセス制御メカニズムエンタープライズチャットボットの使用向けにすでに構築されています。次のような永続情報プロトコルアルウィーヴ機械の出力が受ける可能性のある「ブラックボックス」効果を軽減するために、意思決定のトレーサビリティの基礎を築いています。

エージェント固有のリスクに関しては、不正行為や不正操作から保護するためのより多くの機会が、以下の RFS で概説されています。

相互運用性

上記の「従業員としてのエージェント」の例えをさらに拡張すると、効果的な組織を形成するには、これらのエージェントが互いに効果的に調整できる必要があります。組織レベルを超えて、ビジネスエコシステムとより広範な経済を完全に再構築するために、エージェントの組織は他のエージェント組織と連携する方法も学ぶ必要があります。ここからの調整の問題は（人間社会と同様に）複雑になり始めます。

で行われている作業を中心に、エージェント間の通信プロトコルに有望な初期の兆候がすでにいくつかあります。キャメル。

エージェント間のコミュニケーションは優れていますが、アクティブなエージェントを調整するという点では最初のステップにすぎません。

考慮すべき調整の問題の例をいくつか示します。

私の個人「インフルエンサー」エージェントは、アリス/ボブの個人「インフルエンサー」エージェントとどのように連携できますか?
私の個人エージェントは他のエージェントの評判をどのように判断できますか?他のエージェントが不審な行動をしている可能性があるかどうかを判断するために、どのようなフィルターが設置されるのでしょうか?
私のエージェントが、異なるソフトウェアを使用していたり、異なる規制の下で動作している可能性がある他の人のエージェントと対話できるようにするには、どのような標準が必要ですか?

この寄せ集めの問題が解決されれば、人類は「雇用のない」社会に似たものへの道を順調に進んでいると私は信じています。完全に二番目に優れているのに、基本的で反復的なタスクを行うことに何の意味があるのでしょうか?

この従業員主義の喪失は、AI が普及したときの意味の喪失となぜか混同されることがよくあります。私はほぼ正反対のことが当てはまると信じています。 AI が「私たちの仕事を奪う」とき、それはあらゆる個人を農奴から管理者へと導くパラダイムシフトとなるでしょう。誰もが、見たいものを世界に届けるために、非常に有能で信頼できる仲間たちを手元に持つことになります。この世界における人間の重要な「仕事」は、見たいビジョンを実行するためにこれらの仲間を管理することです。

したがって、この投稿のタイトルです。自律エージェントの浸透により、タスクモンキーからマネージャーまですべての個人が大幅に昇進することになります。

何が欠けている？

ユーザーフレンドリーなエージェント展開ツール。エージェント、そして最終的には人工知能全体の最も重要な原則は、タスクの自動化です。

その定義を使用すると、ザピエル技術的にはパーソナルエージェント展開の世界的リーダーであり、 UiPathエンタープライズ展開の世界的リーダーです。しかし、これら 2 つのツールのいずれかを使用したことがある人なら、これらのツールをうまく活用するために必要な時間と労力がわかるでしょう。これらのシステムを動作させるために費やされる労力、時間、コンサルティング費用をすべてわかりにくくするにはどうすればよいでしょうか?

Alex Lieberman 氏の上記のアイデアは、個人レベルと企業レベルの両方で自動化の将来を考えるための出発点を示しています。 Zapier の問題は、ユーザーがワークフローをリバースエンジニアリングする必要があることです。直感的にトレーニングされたツールや、ユーザーのワークフローをトレーニングしたツールについてはどうでしょうか?

Excel マクロこれは、ユーザーセッションの記録を使用して、ユーザーが最小限の思考で実行できる繰り返し可能なタスクのセットを適用する方法を示す、実際には悪い近似値ではありません。このようなユーザーセッションの記録をブラウザー全体に適用して、さまざまなアプリ間で動作させることができ、ユーザーが勤務時間の 50% 以上、そして最終的にはクリエイティブ以外のタスクをすべてオフロードできるようになったらどうなるでしょうか?

エージェントの個人ユニバースを効果的に管理するために、最も基本的に活用できる機会は、個々のエージェントの CRMです。このような CRM は、個人が自由に使える個々のエージェントの指示/プロンプト/意図に関する単一の信頼できる情報源として機能します。これは、エージェントのパフォーマンス管理のために別のダッシュボードと統合できます。

エージェントの展開やカスタマイズにあまり関与したくないユーザーには、すぐに使える汎用エージェントパッケージを利用する機会があります。エージェントの生産性が証明されると、役割の説明に応じて事前に定義された一連のタスクを実行できる、事前にトレーニングされたエージェントのセットを購入する市場が発展する可能性が高くなります。

パーソナルエージェント展開の設計空間には、Log10 や Superagent などの既存の開発者展開ツールの足跡をたどる適切な道筋があります。これらのツールは、エージェントの展開を管理するのには優れていますが、エージェントや自動化がどのように機能するかに関する知識がほとんどないエンドユーザー向けには設計されていません。

エージェントのリソース割り当てに対するインセンティブメカニズム。エージェントがどれほどスーパーインテリジェンスになるかに関係なく、エージェントは常に活動を続けるためにリソースに依存します。機械の脳も人間の脳と同じように栄養を必要とします。そして、人間の経済全体が、皿に食べ物を盛り付ける必要性を中心に発展してきたのと同じように、エージェントの経済全体も、希少な資源を最も需要のあるところに割り当てることに専念することになるでしょう。

エージェント経済では、次のようなものを割り当てるために市場が必要になります。

計算能力。どのエージェントがどのタスクに対してどのタイミングでどの品質の CPU/GPU リソースを取得しますか?
メモリー。要求の高いエージェントは、要求の低いエージェントのメモリ「不動産」をどのように借りたり購入したりできるのでしょうか?
エネルギー。エージェントがホストされている場所と消費するエネルギー量に基づいて、エージェントに電源を最適に割り当てるにはどうすればよいでしょうか?これはエージェント、サーバー、オペレーター、または個人にどのように請求されますか?
接続性。 WiFi、携帯電話ネットワーク、その他の通信チャネルへのアクセスはどのようにして決定されるのでしょうか?

センサーとアクチュエーターは、拡張可能なパズルのもう 2 つのピースであり、普遍的ではありませんが、エージェントによって需要が見込まれます。したがって、それらについては、以下の別のセクションで説明します。

私は長い間、暗号通貨がこれらの経済の交換手段となるだろうと考えていました。プログラマティックデジタルエージェントは、プログラマティックデジタル通貨を欲しがります。

この仮定に基づいて、これらの希少な API 可能なリソースの共有をエージェント間で最適に割り当て、奨励し、リソースが常に最大限に活用されるように、暗号化ネットワークをどのように設計できるでしょうか?人間の経済のデジタルレプリカとの交換手段となり得るこのようなトークンの市場規模は、当然のことながら巨大です。暗号通貨の分野で見てきたように、これらのネットワークの拡張を支援することで派生的な機会が生まれるでしょう。エージェントのリクエストをバンドルするには何が必要でしょうか?人間以外の取引には新しい決済方法が必要になるでしょうか?

ここでの成果は、エージェントがエージェント固有のウォレットを必要とする可能性が高いという事実でもあります。 Worldcoin のようなプロトコルが人間性の証明の開発を競うのと同じように、デジタルウォレットのような特定のエージェント固有のプロトコルを操作するために、リバースプルーフオブマシンが登場する可能性さえあります。

人間以外の経済を再発明するには、多くの疑問が投げかけられます。

機能性薬剤のマーケットプレイス。私たちは現在、自律エージェントのライフサイクルにおいて、開発者に非常に重点を置いた取り組みを行っている段階にいます。最終的には、市場はカスタマイズの余地がほとんどなく、導入と管理が簡単な既製のソリューションを提供するように移行するでしょう。

これは、自律エージェント向けの取引所やマーケットプレイスの構築を検討している先行者にとって、計り知れない機会を生み出します。人々は一般的な形式のエージェントを購入して迅速かつ安価に導入できるようになるだけでなく、開発者はさまざまなユーザーのニーズに合わせたより高度で特殊なエージェントの開発から収益を得ることができます。過去の商品やサービスのあらゆるカテゴリーと同様に、プレステージのレベルが異なれば、価格帯も異なることになるでしょう。

開発者 (または開発エージェント) は、クラス最高のものを求める人々に提供する、非常にハイタッチなホワイトグローブエージェントソリューションにプレミアム価格を請求する方法を見つけるでしょう。同様に、企業は、セキュリティとプライバシーの最高水準の保証を備えたエージェントに対して、より多くの料金を支払うことをいとわないでしょう。

エージェントのレンタル市場も活発になるでしょう。一時的な仕事を請け負っている人々は、新しいエージェントに市場価格を使いたくないかもしれません。人々は、エージェントを使用するうちにトレーニングを受け、改善できるという理由で、喜んでエージェントをレンタルするでしょう。エージェントを担保にして、前払いの現金と引き換えに他の当事者がレンタルできるようにする金融市場が誕生するかもしれません。レンタル期間中の活用を通じてエージェントがトレーニングされる可能性もあります。

現在のウェブと同様に、マーケットプレイス領域は 1 人の有力なプレーヤーに限定されることはありません。さまざまなユーザー、さまざまな価格帯、さまざまな仕様のためのさまざまな市場の豊かなエコシステムが存在します。これにより、エージェントマーケットプレイス市場は信じられないほど豊かなデザイン空間になります。

ユニバーサルタスクコーディネーター。これは、上記の「New Zapier」のポイントのほぼ拡張です。多数のエージェントを自由に使える状態で、どのようにして全員が同じ認識を持っているかを確認するにはどうすればよいでしょうか?

各エージェントの初期目標とタスクの優先順位付けの出力が、全体的な「組織」または全体の目標と一致していることを確認するには、ツールが必要になります。

この意味でのタスクコーディネーターのビジョンは、短期的には、エージェントのアクティビティを (おそらく上記の CRM を通じて) 監視してこれを確実にし、エージェントを正しい軌道に乗せることができる人間参加型システムになる可能性があります。最終的には、この人間のフィードバックに基づいて、組織または個人の広範な目的に合わせてエージェントの優先順位を十分な精度でマッピングできるプロトコルを設計できます。

IoTエージェント。 「AI と空間コンピューティングはどこで相互接続するのか?」という質問を提起するのは私が最初でも最後でもありません。

この点については、前回の記事ですでに簡単に触れました。完全にパーソナライズされたユーザーエージェントに向けて進歩するにつれて、ユーザーエージェントが (拡張/仮想/拡張された環境に加えて) 私たちの自然な生きた環境に参加するようになるのは避けられません。

これの最も明白な応用はモノのインターネットです。ステーキを調理して、パートナーの好きなように調理する必要がありますか?あなたのエージェントがキッチンでお手伝いします。鶏肉を冷凍庫に長時間放置しすぎていませんか?過去の問題です。エージェントは 3 時間前にそのことを伝え、誰かにその仕事を任せました。これらの IoT エージェントは、現在の電話のような単なる通知「ナッジ」システムではなく、ユーザーの個人的なコンテキストを理解し、便利で正しい間隔で動作します。

人間エージェントのレプリカ。キャラクターAIは、有名人に扮したチャットボットと簡単に会話できることを背景に、すでに 1 億ドルを調達し、5 万人以上の登録者を集めています。あたかもモーガン・フリーマンであるかのようにベッドサイドの物語を読むLLMと話してください。 LLMイーロン・マスクにディーゼルトラクターについての考えを聞いてください。などなど。

これはおもちゃとしてはきちんとしているが、他人の立場に立って、望む人や要求する人と会話したり、エージェントの助けを借りてほとんどの生活を送ったりすることに関して、AI によって人々ができることの表面をなぞっただけである。まさに彼らのやり方です。

自律エージェントが人間の行動を再現し、生きた経験に基づいて訓練する方法を学び始めると、自律エージェントは自分が代表する人間の表現になり始めます。これは、他人の体と心の中で生きられる可能性への窓を示しています。

たとえば、グライムスが次のステップに進みたかったとします。彼女の IP をオープンソース化する。今、彼女は人々に自分のように生き、自分のように物事を経験する経験を与えたいと考えています。 Grimes が十分な期間にわたって個人の自律エージェントと協力している場合、これらのエージェントを複製して他の人が使用し、「The Life of Grimes」を体験できるようにすることができます。

バイオマーカーなどへのアクセスに関して、これらのエージェントが誰かをどの程度詳細に観察できるかに応じて、この種の複製は、生きた経験や感情（つまりクオリア）を互いに共有することにも適用できます。まさに、素晴らしい新世界。

余談ですが、自律エージェントが有名になり始めると、一部のエージェントが他のエージェントよりもこのツールをうまく活用することを学ぶことは避けられません。これにより、エージェントの教育と指示に時間を費やして自分の最善の利益になるように行動する人が、他の人が使用できるエージェントの複製の市場を作成できるようになり、独自のエージェントをトレーニングする学習曲線や専門性を回避できます。

センサーおよびその他のアクチュエーター用のエージェント固有のネットワーク。実行能力を最大限に発揮するには、ほとんどのエージェントが何らかの物理的アクチュエーターにアクセスして知能を発揮する必要があります。

このインテリジェンスを現実世界にもたらすための避けられない需要を平準化するには、さまざまなエージェントが特定の時間にさまざまなアクチュエータにアクセスできるように市場を創出するネットワークが必要となります。これは、自律エージェントが情報業務の世界から重工業の世界に移行すると、特に重要になります。

ソフトウェアを構築する際の制約はハードウェアを構築する場合よりも少ないため、近い将来にはロボットよりも自律型エージェントが増えるでしょう。そのため、これらのエージェントが実行したい物理的な作業を実行するための物理的な「身体」が不足しています。これにより、代理店経済のための事実上の労働市場が形成されます。

これが現実になった場合、人間の労働市場の経済メカニズムのうちどれが適用されるでしょうか?ロボットの所有者は、エージェントに自分の物理的な時間のレンタル料としていくら請求できるでしょうか?ロボット (または他のアクチュエーター) は、エージェントの仕様に基づいて標準化または特殊化する必要がありますか?人工知能によって管理される機械アクチュエータが生活環境を占拠するようになるにつれ、多くの未解決の問題が混乱を招く機が熟しています。

Web2 と同様に、データは人々がそれを提供するチャネル (Google 広告など) へのアクセスに喜んでお金を払う重要な商品です。自律型時代では、センサーはデータの重要な「ベンダー」になります。カメラ、GPS、LiDaR、その他のセンサー一式は、エージェントにリアルタイムの意思決定データを提供するために利用されます。そのため、i) エージェント間のデータ交換を促進するネットワーク、および ii) エージェントがこのデータをリアルタイムで通信できるようにするオラクルが必要になります。

エージェントの標準化と相互運用性プロトコル。自律エージェントが相互に効果的に調整するには、いわばデジタルの「言語の壁」を克服するための普遍的な標準が必要です。これを達成するには何が必要でしょうか?

ミドルウェアシステムはソリューションの 1 つであり、あるエージェントから別のエージェントにメッセージを「変換」する仲介者として機能します。あるいは、統合や変換プロセスを簡素化する相互運用性 API や SDK を構築することもできます。第三に、エージェントが遭遇し始めたばかりの、または過去にエージェントの調整が困難であることが判明した新しい種類のスキーマのボトムアップ標準のための新しい種類の市場を開発するための余地がたくさんあります。

コンテキストDAOは、これが Web3 分野でどのようにすでに行われているかを示す良い例を示しています。

高度なアプリケーション用のエージェントテストネット。個人のツールや情報をエージェントに完全に信頼するために、個人は安全なサンドボックス環境を作成して、エージェントがどのように機能するかを理解する必要があります。

テストネットが AI の安全性のための公共財になる傾向にある可能性は非常に高いですが、それでも、これは追求すべき野心的で影響力のあるプロジェクトです。

機械倫理に関する公開投票メカニズム。前回の記事で、責任ある AI 開発に関連する経済の好転と投票手順に人々が確実に参加できるようにするために、人間参加型のマーケットプレイスが引き続き必要であることについて説明しました。

さらにいくつかのアイデア: