企業は単一の、普遍的なAIボットを必要としません。 彼らは、小売カートやプロモーション、銀行預金とリスク旗、SKUスピードとサプライヤーOTIF、ネットワークセルと中断コホート、患者旅行とプロトコル偏差を理解するドメインネイティブエージェントシステムを必要としています。 ビジネス言語は、カノニカルメトリクス、許容関連、ユニット、および線路を解決し、システムは、メトリクス、時間、セグメント、および地理の範囲をブロックし、任意のコンピューティングを費やす前に。 Ontology-first grounding. 複数の回転推論は、二重審査員、構造と明確性のためのLLM批評家1名、数値真実のためのゴールデンデータ層を介して実行されます。 Reliability over autonomy. 十数年以上にわたり、企業は倉庫やダッシュボードに資金を注ぎ込んでおり、決断の遅延は頑固だった。最後のマイルの問題は視覚化のギャップではありません。それは推論のギャップです。それを閉じるには、意図、形態と仮説を明確にし、統制されたデータへの主張をマップし、監査可能なトラックで決断準備の勧告を返すシステムが必要です。これがミルクウェイのポイントです。Praveenとチームは、記述的および診断分析のための代理的意思決定システムを構築しました。それは、過剰な条件、部分的なデータ、脆弱な結合、および監査要件で、現実の企業を扱っています。 「小売業界では、バスケット、UPC、プロモーション、ストア・ウィークを話せないエージェントは、ビジネスにSQLを書くことができない」 - Praveen Satyanarayana “We build constellations of agents, not a mascot bot. Each one knows its domain, its tools, and its guardrails.” -Praveen Satyanarayana What makes this different What Makes This Different Agentic AI は、アクションを選択し、ガードレイル内の目標を追求するためのツールを使用するソフトウェアです. Praveen の貢献は、そのアイデアを測定し、分析のために管理できるようにすることです. The architecture is simple to state and strict to implement. 言語をグラウンドします。 entities, metrics, synonyms, lineage, and admissible join pathways. 曖昧さを拒否します。 Scaffold the execution. Compile plans into guarded tool calls with timeouts, retries, circuit breakers, and SQL structure checks on schema variants. スケジュールの構造をスケジュール変数にまとめます。 競合する説明を生成し、それぞれをフィールド、アウトプット、変換、テスト、およびビジュアルに結び付け、その後、以前の確率、検証するコスト、および予想される情報を獲得してランキングします。 批判的なモデルが明確さとカバーを記録し、金店が数字、関節、フィルター、統計主張を検証します。 決定物語を提供し、テーブル、数字、信頼性、および監査のための完全なトラックへのリンクを提供します。 Why now なぜ今 エラーの複雑化は許しがたいことです。 ステップごとに、謙虚なエラー率は、複数のステップワークフローにおけるエンド-to-エンドの信頼性を崩壊させるため、制限されたステップ、検証、およびヒューマンゲートが重要です。 会話の長さは、トークンのコストと遅延を引き起こしますので、実用的なシステムは明示的なチェックポイントを持つショートステートのタスクを好みます。 “Short, verified steps beat long, clever chats.” - Praveen Satyanarayana A crisp domain-native playbook CRISP ドメイン・ネイティブ・プレーブック システムは1つのテンプレートを送信しません。 オントロジーと知識グラフ、検証されたツールセット、仮説のスタートライブラリ、および受け入れメトリックを含むドメインパッケージを送信します。 リテール、BFSI、サプライチェーン、テレコム、ヘルスケア、および旅行はすべて同じバックボーンを使用しますが、異なるパッケージをインストールします。 合併とラインはドメインによって異なりますので、信頼性はローカルに定義され、中央に実施されなければなりません。 「信頼を失う最速の方法は、間違ったデータで迅速に回答することだ」 サタナラヤナラヤナ Knowledge graph and ontology operations 知識グラフとオントロジー操作 Ontology and knowledge graphs act as the contract between language and data. They encode entity relationships, metric lineage, join admissibility, synonyms, and policy tags. They also carry path costs and quality labels so planners prefer short, reliable routes. この層の操作には: Drift monitors. Detect schema changes, definition shifts, unit mismatches, and relationship breaks. スケジュールの変更、定義の変更、ユニットの不一致、および関係の断絶を検出します。 アダプターとカリキュラム 新しいテーブル用のドメインアダプターを提供し、弱点を硬化するカリキュラムタスクをカリキュラムします。 Synonyms and alias management. Maintain a compact term store supported by embeddings for recall and by hard rules for precision. 呼び出しのための埋め込みと精度のための厳しいルールによってサポートされるコンパクトな用語ストアを維持します。 実行前に隠されたスケジュールの変数でプレフライトチェックと構造 SQL テストを実行します。 Lineage transparency. Record tables, joins, filters, and aggregation rules in a trace that is explorable by role. テーブル、 joins、フィルタ、および合併ルールを、ロールによって探求可能なトラックに記録します。 Custom evaluations and rubrics Custom Evaluations and Rubrics(カスタム評価とセクション) 一般的なリーダーボードは、エンタープライズの信頼性を測定しません。MilkY Wayは、行動を学習のためのシグナルと、ゲートウェイのためのゲートウェイに変換するカスタマイズされたルートや受け入れテストを使用します。 Framing and guardrail signals. Clarify count, scope-lock precision, missing information requests, task type detection, and interrupt or override availability. Framing and guardrail signals. Scope-lock precision, missing information requests, task type detection, and interrupt or override availability. Field mapping accuracy against a gold shortlist, join validity rate on the ontology graph, aggregation rule adherence to lineage, and escalation latency when required data is absent. フィールドマッピングの正確さは、ゴールドショートリストに比べて、オントロジーグラフ上の有効率、結合ルールの接続、および要求されたデータが欠如した場合のエスカレーションの遅延です。 Plan completeness, statistical test appropriateness, SQL structural correctness, execution success ratio, and exploratory depth across distributions, cohorts, outliers, and controls. 計画の完全性、統計的なテストの適切性、SQLの構造的正確性、実行の成功比率、および分布、コホート、アウトリー、およびコントロールの間の探索深さ。 Causal attribution confidence, actionability lead time, persona fit for executive and analyst consumption, and trace transparency index. 因果関係の信頼性、行動性のリードタイム、幹部とアナリストの消費に適した人格、およびトレース透明度指数。 Role-shaped rewards that credit clarifiers for scope-lock improvements, mappers for field accuracy and join validity, executors for structural correctness, and reporters for persona fit and transparency, with a team bonus for on-time closure above confidence thresholds. 役割形の報酬は、範囲ロックの改善、フィールドの正確性と加入の有効性のためのマッパー、構造的正確性の実行者、およびリポーターのパーソナの適合性と透明性を提供します。 これらの評価は、実際のスケジュールを反映する合成タスクでオフラインで実行され、影またはゲートフローとしてオンラインで実行されます。 How multi-turn reasoning actually runs マルチターン論理が実際に動く方法 明確化は、ユーザに最小限の負担を負わせる範囲ロックに近づきます。仮説エンジンは、ドメインライブラリから候補者と、以前のケースを回収し、共存または競争を記録します。マッパーは、それぞれの仮説をフィールドに結びつき、結合し、要因マップを生成します。執行者はSQLを実行し、タイムアウトと回路ブレーカーの下でテストし、探究的な深さを追跡します。批判とゴールドの裁判官は、物語の品質と数値の真実を繰り返します。レポーターは、証拠、信頼、および次の行動で役割特有の物語を組み合わせます。各ステージは、評価と強化の Reliability and economics by design デザインによる信頼性と経済性 ツールは、成功、部分的成功、サンプル、およびコストを含む構造化されたフィードバックを返します。破壊的な操作はゲートされています。メモリは、無限のトランスクリプトではなく、エピソード的でセマンティックです。 Adoption that earns trust 信頼を得るための養子縁組 チームは、アナリストが範囲ロックと最初の推奨を検証するヒューマン・イン・ザ・ループから始まり、ルーチン・パスが自動的に実行され、例外はレビューを必要とするヒューマン・オン・ザ・ループへと進化します。それから、ロールバックと完全な監査を伴う狭い、高い信頼性のワークフローのための選択的な自主性を承認します。 Open work, stated plainly オープンワーク、明確に述べた Ontology and graph upkeep carry real cost. Drift detection and domain curricula are ongoing. Reward gaming is possible and must be checked with cross-rubric audits and surprise variants. Synthetic-to-real gaps persist and benefit from targeted shadow runs on live incidents. 長いトラックでのクレジット割り当ては騒々しいので、役割形の報酬とチームボーナスは安定性を向上させます。 Why this vision is credible なぜこのビジョンは信頼できるのか Praveenのアプローチは、エージェントのオーケストラ、ツールの使用、回収、およびシグナルからの学習を組み合わせ、それらをエンタープライズの制約に固めます。その立場は、オントロジーゲートとゴールド判決とモジュールでなければならない場所で、交換可能なツールとドメインアダプターでなければなりません。最後のマイルは、時間とコントロールの下で有用な分析を行うことについてです。 “A narrative is only as strong as its trace. We ship the trace and the answers.” ストーリーはその痕跡ほど強力で、私たちはその痕跡と答えを送ります。 サタナラヤナラヤナ References 参照 Oracle、What is Agentic AI、2025年 Gartner, Top Strategic Technology Trends for 2025, Agentic AI, 2024 Google DeepMind, Introducing Gemini 2.0 for the agentic era、2024年。 『Utkarsh Kanwat: Why I'm Betting Against AI Agents in 2025, 2025』 Navin Chaddha, AI-First Professional Services: The Great Equalizer is Coming、2025年 エージェントの展開と企業の採用に関する業界カバー、2025年 このストーリーは、HackerNoonのビジネスブログプログラムの下で、Kashvi Pandeyによってリリースされたものです。 このストーリーは、HackerNoonのビジネスブログプログラムの下で、Kashvi Pandeyによってリリースされたものです。