受動AIチャットボットの時代が終わり、今、私たちは世界の時代に入っています。 積極的に理由、計画、およびタスクを実行するシステム。 Agentic AI 組織にとっては、これは生産性の潜在的な飛躍を意味しますが、また、新しいエンジニアリングの課題をもたらします。 この記事では、AIエージェントの解剖学、どのように 最終的に統合の障壁を解決し、人間とエージェントが効果的に協力する安全でスケーラブルなシステムをどのように構築できますか。 Model Context Protocol (MCP) AIエージェントって何? いくつかのAIエージェントは単にシステムプロンプトであり、すべての思考を行うモデルに送信されるツールのコレクションです。しかし、LLMを使用してアクションを推奨し、提案するより強力なAIエージェントもあります。 • 制御実行:ステータスマシン、タスクグラフ、リトリ、タイムアウト • Enforce ポリシー: auth, scope, RBAC, allow / deny ルール • アクションの検証:スケジュールチェック、セキュリティフィルター、サンドボックス • メモリ/ステータス管理:データベース、ベクトルストア、セッションステータス • 連携エージェント:メッセージ転送、役割分離、投票 • ハンドル エラー: rollbacks, circuit breakers, human-in-the-loop 標準的なLLM(大言語モデル)は被動的であり、回答を生成するためにあなたの入力を待つ一方で、AIエージェントはアクティブです。 エージェント AI システムは、LLM に複数のエージェントとそのツールの定義を含むシステムプロンプトを送信することでセッションを開始します。これらのツールのいくつかは、エージェントが他のエージェントを呼び出し、文脈そのものを管理し、さらには次のステップのためのモデルを選択することを可能にします。 LLM Chatbot AI Agent Flow User Input -> Model -> Output User Goal -> LLM -> Reasoning/Planning -> Tool Use -> Action -> Verification -> Output Summary Gives you advice but you have to do the work. You give the agents a goal and access to software, they come back when the job is done. フロー ユーザ入力 -> モデル -> 出力 User Goal -> LLM -> Reasoning/Planning -> Tool Use -> Action -> Verification -> Output 概要 アドバイスをしてくれるけど、仕事はやらなければいけない。 あなたはエージェントに目標とソフトウェアへのアクセスを与え、彼らは仕事が終わったときに戻ってくる。 エージェントAIシステムを構築するためのマスターシップは、適切なガードレイルと検証を提供しながら、あなたの目標を達成するためにLLMを可能にするエージェント、ツール、およびプロンプトの適切な組み合わせを見つけることです。 この目的のために、AIエージェントに利用可能なツールやその他のリソースを管理することは主要な焦点です。 モデル コンテキスト プロトコル 導入されたオープンスタンダードです。 2024年11月、AIシステムが外部データやサービスに接続する方法を標準化する。 MCP アントロピー MCPの背後にあるアイデアは、すべてのLLM APIプロバイダーがLLMにツールを呼び出すことを可能にすることです。 MCP 以前は、Agentic AI システムに第三者ツールを統合することで多くの摩擦が加わりましたが、ファイルを読み取る、機能を実行する、および文脈的なプロンプトを処理するための普遍的なインターフェイスを提供することで、MCP は、情報がどこに存在するかにかかわらず、AI モデルが安全かつ一貫して必要なデータにアクセスできるようにします。 リリース以来、このプロトコルはOpenAIとGoogleを含む主要なAIプロバイダーによって採用されており、AIシステム統合の業界標準としての役割を強化しています。 MCPは、4つの主要なコンポーネントを含むシンプルなクライアントサーバーアーキテクチャを通じて動作します。 Claude Desktop、現代のIDEs、またはあなたのAIシステムのようなホストアプリケーション。 ホストからサーバーへの一対一の接続を確立するMCPクライアントは、しばしばAIフレームワークの組み込み機能です。 ツール、リソース、およびプロンプトを暴露するMCPサーバー。 クライアントとサーバー間のコミュニケーションを管理する輸送層。 MCPはまた、第三者プラットフォームが自身の公式のMCPサーバーを公開することによってAIエージェントに能力を露出するエコシステムへの扉を開いた。 で、 で、 そして、 すべての MCP サーバーが公開されています。 Microsoft について AWS アトランティス SUMO 論理 MCP は重要な問題を解決しますが、エージェントにとっては単なる問題ですが、次に、安全なエージェント AI システムを設計する方法について見ていきましょう。 セキュアエージェントAIシステムの設計 エージェント AI は災害的に間違える可能性があります. There are multiple risks such as: データをエクスフィルタするためにワークフローをハイジャックしたり、ランサムウェアを実行したりするプロンプトインジェクション。 ツールチェーンを介して、アカウントを排出したり、生産システムを削除したりするエスカレーションの特権。 APIコストで数百万を燃やす無限のループ。 不可逆的な取引やコンプライアンス違反を引き起こす幻想的な行動。 **Token Torching ** 悪意のある俳優がMCPを通じてトークンをハイジャックする。 エージェントはしばしば、API、ブラウザ、およびインフラシステムへのアクセスを委ねられます。セキュリティなしでは、これはあなたのリスクを大幅に拡大します。 入力検証、出力監査、およびヒューマン・イン・ザ・ロック・エスカレーションは、検証の支柱です。 決断は、爆発半径や財政的影響が大きいときには決して完全に自律的ではありません。 サンドボックスと明示的な許可制限は、許可されていないアクセスを防止します。 各エージェントは、ユーザの許可を相続するのではなく、最小特権の認証と範囲のトークンを含む独自のアイデンティティを受け取るべきです。 再起動論理、バックバックモデル、および異常検出を通じての欠陥容認は、システムが失敗時に優雅に劣化することを保証します。 標準化された遠隔測定、構造化された記録、メトリック収集、リアルタイムモニタリングダッシュボードを通じて実装された深い観測は、迅速な検出と反応を可能にします。 効果的な複数のエージェントシステムのエンジニアリングは、1つまたは複数の調整パターンを組み込む意図的なアーキテクチャ設計を必要とします。 監督エージェントが専門労働者を調整し、グローバルな状態を維持する中心的なオーケストラ。 柔軟なエージェント対エージェント相互作用を可能にする分散型ピアツーピアコミュニケーション。 エージェントを抽象化のレベルに組織する等級的な代表。 Sumo Logic のような開発環境 (セキュリティオペレーションセンターのためのエージェントAIプラットフォーム)は、生産展開前にエージェントシステムを安全に再起動するための不可欠なインフラストラクチャを提供することによって重要な役割を果たすことができます Dojo AI は、その設計原則とセキュリティに従って慎重に策定されています顧客は、Dojo AI を使用して、AI ベースのコア能力のために、独自のエージェントAI 環境(Dojo AI に類似)を構築することができます。 データクエリを実行し、自社のAIエージェントからDojo AIエージェントの呼び出しを行うことができます。 ドジョ AI Sumo Logic MCP サーバー 次に、人々がAgenttic AIシステムと相互作用するさまざまな方法をいくつか見ていきましょう。 人々がAIエージェントと協力する方法 従来のシステムは、正確に定義されたワークフローと事前プログラムされたアルゴリズムに従います. User input and output are fully structured. Even in dynamic systems, user input can deterministically control the flow. 従来のシステムでは、ユーザーの入力と出力は完全に構造化されています。 しかし、エージェントAIシステムは異なります。LLMは流れを制御します(そのガードレイル内)。ユーザーは初期の意図と動機を提供し、後に承認者とゲート機能として機能します。 では、これらのエージェントとどう協力するのがベストなのでしょうか。 AIエージェントと相互作用する最も一般的な方法の1つは、LLMとそのエージェントとテキスト、画像、ファイルを交換できるチャットボットを介してです。 もちろん、ChatGPT、Gemini、Claude Desktop のような一般的なチャットボットは、あなたのエージェントが箱の外に存在することを知りませんが、エージェントはMCPツールとして導入することができます。 もう一つの興味深いオプションは、エージェントがチャンネルに参加し、ユーザーと対話し、チャンネルを自動的に監視し、イベントに自動的に反応することを可能にするSlackアプリケーションを構築することです。 Slackのユーザー体験はすでにグループチャンネルやトレードをサポートしているため、エージェントはスクリーンを混乱させることなく、思考の連鎖や引用などの詳細を追加することができます。 さらに専門的なユーザーエクスペリエンスが必要な場合は、エージェントのためにカスタマイズされたウェブ、デスクトップ、またはモバイルアプリケーションを構築することができます。 例えば、チャットボットを作ることもできます。 , a Slack application integration, or a custom suite of agents such as . モバイル ドジョ AI エージェントの未来 たぶん、AIエージェントについて理解すべき最も重要なことは、彼らはあなたが思っているよりも速く来ているということです。過去に、パーソナルコンピュータ、インターネット、携帯電話などの主要なテクノロジー革命は数十年にわたって普及し、イノベーションのペースは管理可能でした。 多くの専門家は、今後数年で、AIエージェントは最高の人間よりも知識の仕事をうまく行うことができると予測しています。彼らは科学的発見を解き明かし、前例のない生産性の向上を提供します。 LLMsはすでに多くのタスクと人間を実行することができますが、彼らは長期の視野を計画し、運用し、複雑さに対処し、一貫性を維持する能力を欠いているが、慎重に構築されたエージェントのウェブと、長期の視野のタスクを達成するために複数のイテレーションで協力するツールのコレクションセットで、これらの制約が取り除かれている。 業界標準化 私たちは今、AIエージェントの技術、ツール、フォーマットの標準化を見始めています。 これは、Agentic AIがオープンで協力的な方法で進化することを保証するLinux Foundationの新しいイニシアチブです。 Anthropic、OpenAI、Amazon、Google、Microsoft、およびBlockを含み、MCP、Goose、およびMCPを含むいくつかの著名なエージェント技術をホストしています。 . Agentic AI Foundation(AAIF) メンバー エージェント.md 他のオープンな取り組みも、Googleの そして (同様に、アントロピーも含まれています。 Agent2Agent(A2A)プロトコル エージェントスキル ダイナミックなユーザー体験 LLMとエージェントは、クエリ、ユーザー、会話履歴、およびその他に応じて、フライト上で適切なUIを生成します。 たとえば、あなたが株式市場について尋ねる場合、今日のビジネスニュースの一般的な概要を提供するのではなく、AIシステムは、あなたの現在のポジションと関連する教育材料へのリンクを含む歴史的なタイムラインとケーキグラフを表示することを決定するかもしれません。 AIエージェントへの転換 エージェントの転換はここにあります。我々は被動的なテキスト生成からアクティブで自主的な作業に移行しています。我々が見たように、この転換は単に新しいモデル以上のものが必要です。 成功するためには、組織は以下に焦点を当てなければならない: モデル・コンテキスト・プロトコル(MCP)の活用 単純な推奨事項を超えて「防衛の深い戦略」へと進む。 Slack アプリやカスタム UI などのインターフェイスを設計し、人間が意図を提供し、エージェントが実行を処理する。 AIエージェントは間もなく、トップの人間の知識労働者を上回り、重大な科学的および生産性の利益を解放し、最終的にロボット技術を通じて物理的な仕事に拡大する可能性があります。 本当に素晴らしい一日を!