Mēs nepareizi veidojam AI sistēmas. Ne mazliet nepareizi, fundamentāli, strukturāli, katastrofāli nepareizi. Komanda atklāj liela valodas modeļa burvību.Viņi iesaiņo to Python skriptā.Viņi dod tai piekļuvi datu bāzei, API vārtiem un klientu atbalsta žurnāliem.Viņi izmet trīs gigabaitus dokumentācijas konteksta logā, jo "1 miljons žetonu" izklausās kā bezgalīga uzglabāšana. Viņi to sauc par “agentu”. Realitātē viņi ir izveidojuši Dieva aģentu. monolītisks, visaptverošs, nediferencēts loģikas blobs, kas cenšas būt CEO, janitor un datu bāzes administrators vienlaicīgi. Un tas neizdodas. Tas halucinē. tas kļūst sajaukts. tas maksā naudu par žetonu izmantošanu. Latence krīt uz augšu, līdz lietotāja pieredze jūtas kā gaidot zvanu savienojumu 1999. gadā. Kad tas pārtrauc (un tas vienmēr pārtrauc) inženieri nevar to labot, jo loģika nav kodā. Esmu pavadījis pēdējo gadu, sadalot šīs sistēmas. risinājums nav labāks. tas nav lielāks modelis. risinājums ir arhitektūra. Pilnīga tehniskā analīze ar kodu un etaloniem Pilnīga tehniskā analīze ar kodu un etaloniem Kāpēc mēs apstrādājam 1 miljonu žetonu kā bezgalīgu RAM? Pašreizējo ortodoksiju AI attīstībā vilina "konteksta loga mīts". Mums ir pārdots meli. Meli ir tas, ka, ja jūs piešķirat modelim pietiekamu kontekstu, tas var atrisināt jebkuru problēmu. Pārdevēji nospiež "bezgalīgo kontekstu" kā galīgo funkciju. 128k. 1 miljons. 2 miljoni žetoni. Iemesls ir vilinošs. Neuztraucieties par arhitektūru. Neuztraucieties par datu glabāšanu. Vienkārši izmetiet to visu. Modelis to izdomās. Tas noveda pie Dieva aģenta paradigmas pieauguma. Šajā pasaules redzējumā "Agents" ir unikāla vienība.Tas tur visu pieteikuma stāvokli.Tam ir piekļuve katram rīkam bibliotēkā.Kad lietotājs uzdod jautājumu, Dieva aģents saņem vaicājumu, aplūko tā masveida kontekstu (kas satur visu Visuma vēsturi) un mēģina saprast savu ceļu uz atbildi. Tas izskatās kā zinātniskās fantastikas sapnis par unikālu, apzinātu AI. Bet ražošanā tas ir murgs. Mēs efektīvi lūdzam jaunāko izstrādātāju atcerēties visu kodu bāzi, uzņēmuma rokasgrāmatu un juridiskos arhīvus, un pēc tam lūdzam tos 30 sekunžu laikā labot CSS kļūdu. Viņi neatrisinās kļūdu, viņiem būs panikas lēkme. Kāpēc mans aģents maksā 50 dolārus, lai teiktu "Es nezinu"? God Agent arhitektūras plaisas ir redzamas ikvienam, kas nospiež kodu ražošanai. Jo vairāk informācijas jūs sniedzat, jo mazāk uzmanības modelis pievērš kritiskajiem gabaliem. Tas nav tikai sajūta. Tas ir arhitektūras trūkums. Pētījumi liecina, ka modeļi cīnās, lai iegūtu informāciju no garo kontekstu vidus. Nespējot kurēt, mēs aktīvi kaitējam veiktspējai. Mēs izveidojam sistēmas, kurās neatbilstīgas dokumentācijas "trauksme" pārspēj lietotāja konkrētā nodoma "signālu". 1. Context Pollution (The Needle in the Haystack) Katrs žetons maksā naudu. Katrs žetons prasa laiku, lai to apstrādātu. Dieva aģents, kurš atkārtoti izlasa 50 000 žetonu kontekstu katrai sarunas kārtai, sadedzina naudu. Tas ir aprēķinu izšķērdīgs. Mēs darbojamies ar superkomputeru, lai atbildētu "jā" vai "nē", jo mēs neuztraucāmies filtrēt ievades. 2. Latency and Cost Kad Dieva aģents neizdodas, kāpēc tas neizdevās? Vai tas bija ielūgums? Atgūšanas solis? Rīku izeja? Vai arī to vienkārši novērsa neatbilstošs teksta gabals no dokumentācijas 405. lapas? Jūs nevarat testēt ielūgumu, kas maina savu uzvedību, pamatojoties uz masveida konteksta loga mainīgo zupu. 3. The Debugging Black Hole Viens aģents, kam ir piekļuve visam, ir drošības murgs. Ja ātro injekciju darbojas, uzbrucējs pieder pilij. Nav bulkheads. Nav "nulles uzticības", jo arhitektūra paļaujas uz maksimālu uzticību probabilistiskajam modelim. 4. The Governance Void Vai risinājums ir tikai mikroservisi (atkal)? Jā, tā ir tā. Ceļš uz priekšu ir un tās . Aggressive Context Curation Agentic Mesh Mums ir jāaizstāj Dieva aģents ar mazu, specializētu, ļoti ierobežotu aģentu tīklu, kas komunicē, izmantojot standartizētus protokolus. Mesh arhitektūrā neviens aģents nezina visu. Routera aģents zina, kā klasificēt nodomu. Atbalsta aģents zina atgriešanas politiku. Kodēšanas aģents zina Python. SQL aģents zina datu bāzes shēmu. Viņi nedalās konteksta logā, viņi dalās ziņojumos. Tas ir pāreja no monolīta uz mikroservisiem. Tas ir vienīgais veids, kā palielināt sarežģītību. Kad atbalsta aģents strādā, tam nav jāzina datu bāzes shēma. Tam nav nepieciešamas Python bibliotēkas. Tās konteksts ir neparasts. Tas ir kurēts. Apskatīsim atšķirības koda struktūrā. Ieķeksēts kā: The God Prompt Tas ir tas, ko lielākā daļa cilvēku šodien raksta. # GOD AGENT - ANTI-PATTERN # We dump everything into one system prompt. system_prompt = """ You are an omniscient AI assistant for Acme Corp. You have access to: 1. The User Database (Schema: users, orders, items...) 2. The Codebase (Python, React, TypeScript...) 3. The Company Handbook (HR policies, returns, holidays...) 4. The Marketing Style Guide Instructions: - If the user asks about SQL, write a query. - If the user asks for a refund, check the handbook policy then query the DB. - If the user asks for code, write Python. Current Context: {entire_rag_retrieval_dump} {last_50_messages} """ # Result: The model gets confused. # It tries to apply HR policies to SQL queries. # It hallucinates tables that don't exist. Python Nosaukums oriģinālvalodā: The Agency Mesh Šeit mēs sadalām loģiku. maršrutētājs nedara darbu. # MESH ARCHITECTURE - PATTERN # Step 1: The Router Agent # Its only job is to classify and route. It has NO domain knowledge. router_prompt = """ You are a routing system. Analyze the user input and route to the correct agent. Available Agents: 1. billing_agent (Refunds, invoices, payments) 2. tech_support_agent (Python, SQL, Bug fixes) 3. general_chat_agent (Casual conversation) Output JSON only: {"target_agent": "name", "reasoning": "string"} """ # Step 2: The Specialist Agent (Billing) # This agent loads ONLY when called. # It has zero knowledge of Python or SQL. billing_agent_prompt = """ You are a Billing Specialist. You handle refunds and invoices. Tools available: [stripe_api, invoice_db] Context: {user_transaction_history_only} {refund_policy_summary} """ Python Vai jūs redzat atšķirību? Nav iespējams halucinēt SQL sintaksi, jo tā nezina, kas ir SQL. Tās Visums ir mazs. billing_agent Kā aģenti patiešām runā bez halucinācijām? Esmu bijis skeptisks par lielajām tehnoloģijām. tie parasti pievieno bloat. man patīk neapstrādāts kods. Bet Google aģentu izstrādes komplekts (ADK) un aģentu protokols (A2A) ir atšķirīgi. Google ir sapratuši, ka, ja mēs vēlamies, lai aģenti strādātu, viņiem ir jārunā viens ar otru kā programmatūra, nevis kā tērzēšanas roboti. A2A protokols Tas ir spēles mainītājs. A2A protokols ir piegādātāja neitrāls standarts aģentiem, lai atklātu un sarunātu viens ar otru. Tas izmanto "agentu kartes". Tie ir standartizēti JSON metadatu faili, kas apraksta, ko aģents var darīt. Padomājiet par to šādi: { "agent_id": "billing_specialist_v1", "capabilities": ["process_refund", "check_invoice_status"], "input_schema": { "type": "object", "properties": { "transaction_id": {"type": "string"}, "user_intent": {"type": "string"} } }, "output_schema": { "type": "object", "properties": { "status": {"type": "string", "enum": ["success", "failed"]}, "refund_amount": {"type": "number"} } } } Džons Kad maršrutētāja aģentam ir nepieciešams apstrādāt atmaksu, tas nemēģina halucinēt API zvanu. , rokassprādzes caur A2A, iziet strukturēto lietderīgo slodzi un gaida strukturētu atbildi. billing_specialist This is standardisation. It allows us to build an kur aģenti no dažādām komandām vai pat dažādiem uzņēmumiem var sadarboties. Agentic Mesh Pašlaik OpenAI aģents nevar runāt ar Vertex AI aģentu. ar A2A viņi dalās protokolā. Ko tas patiesībā nozīmē Mesh arhitektūras pieņemšana maina visu par to, kā mēs veidojam. Tradicionālā novērojamība (logs, metrikas, pēdas) ir nepietiekama. Mums ir jāredz . Why did the Router hand off to the Billing Agent? Why did the Billing Agent reject the request? We need to trace the cost and latency per node in the mesh. If you don't have this, you aren't building a system. You're building a casino. 1. Observability is Mandatory Agentic Observability Ķēdes pamatojums Dieva aģenta modelī drošība ir binārais slēdzis. Maksājumu aģents netic maršrutētāja aģentam netieši. tas pārbauda lietderīgo slodzi. tas pārbauda politiku. tas ierobežo sprādziena rādiusu. 2. Zero Trust Security Zero Trust Ātrā inženierija kā neatkarīga disciplīna mirst. to aizstāj Reālais darbs ir maršrutēšanas loģikā, shēmas definīcijā un konteksta kurēšanas stratēģijā. 3. The End of "Prompt Engineering" System Engineering Mums ir jākļūst par nežēlīgiem redaktoriem. Mērķis nav aizpildīt kontekstuālo logu. Mērķis ir to iztukšot. Mums ir nepieciešams saspiest. Mums ir nepieciešams apkopot. Mums ir nepieciešams ievadīt tikai tieši to, kas nepieciešams nākamajam tūlītējam solim. Ja aģents ir uzdevums rakstīt SQL, tam ir nepieciešama shēma. Vajadzīga uzņēmuma misijas deklarācija. 4. Aggressive Context Curation Nē (Izklausās acīmredzami.Tomēr es redzu, ka tas tiek ignorēts 90% kodu bāzu.) Lasīt pilnu tehnisko pārtraukumu → Lasīt pilnu tehnisko pārtraukumu → TL;DR par skrāpētājiem Stuffing the context window leads to confusion, high costs, and impossible debugging. God Agents fail: Bažas atdalīšana: Izveidojiet specializētus aģentus (rēķinu, SQL, tērzēšanu), kas labi dara vienu lietu. Izmantojiet protokolus: aģentiem būtu jāsazinās ar