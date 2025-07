Водич за АИ-инжењере и градитеље

Обично почиње са неколико линија Питона и ЦхатГПТ АПИ кључем.





Додајете неколико линија контекста, ударите и чудите се да уопште одговара. Затим, желите да уради нешто корисно. Затим, поуздано. Затим, без вас. То је када схватите да више не позивате само ЛЛМ. Ви градите агента.





Прошле године сам провео сакупљајући скрипте и омотаче, џунглинг ланце ЛангЦхаин који су се осећали више као кућа карата него система, и стално се питам, "Kako ljudi zapravo isporučuju ove stvari?”





Прогонио сам обрасце који су изгледали елегантно у теорији, али се срушили у тренутку када су се појавили стварни корисници. изградио сам агенте који су савршено радили у нотебооку и неуспешно у производњи.





To nije bilo.





Оно што ми је помогло било је успоравање, одузимање ствари и обраћање пажње на оно што је заправо радило под оптерећењем, а не оно што је изгледало паметно на ЛинкедИн-у.Овај водич је дестилација те тешко зарађене јасноћеAko ste prošli kroz slične izazove, ovo je napisano za vas.





Размислите о томе као прагматичном водичу за прелазак са АПИ омотача и ланаца на стабилне, контролисане, скалабилне ИИ системе.

Део 1 - Добијте фондацију исправно

Рани прототипи агента често долазе брзо: неколико функција, неки позиви, и ево, то функционише.





Možda se pitate: "Ako to funkcioniše, zašto komplikovati stvari?"





У почетку, све се осећа стабилно: агент реагује, покреће код и понаша се као што се очекивало. али у тренутку када замените модел, поново покренете систем или додате нови интерфејс, ствари се разбијају.





Обично, проблем није логика или подстицаји; то је дубље: poor memory management, hardcoded values, no session persistence, or a rigid entry point.





Овај одељак покрива четири кључна принципа који ће вам помоћи да креирате солидну основу, базу на којој ваш агент може поуздано да расте и скали.





1 – Екстернизација државе

The Problem:

Не можете наставити ако агент буде прекинут, пада, времена, шта год.

Репродуктивност: желите да репродукујете оно што се догодило за тестирање и дебугирање.

Бонус изазов: пре или касније, желите да покренете делове агента паралелно, као што је упоређивање опција усред разговора или логика раздвајања (Управљање меморијом је посебна тема коју ћемо ускоро покрити.)





The SolutionПреместите све стање изван агента, у базу података, кеш, слој складиштења или чак једноставну ЈСОН датотеку.





Your Checklist:

Агент почиње од било ког корака користећи само session_id и спољашње стање (нпр. сачуван у ДБ или ЈСОН).

Можете прекинути и поново покренути агента у било ком тренутку (чак и након промене кода) без губитка напретка или прекида понашања.

Држава је потпуно сериализована без губитка функционалности.

Исто стање се може хранити вишеструким агентима који раде паралелно током разговора.

2 – Екстернизација знања

The ProblemЧак иу једној сесији, они могу заборавити шта сте им рекли, помешати фазе разговора, изгубити нит, или почети "попуњавати" детаље који нису били тамо.

Модел се фокусира на почетак и крај, губећи важне средње детаље.

Више токова кошта више новца.

Граница и даље постоји: трансформатори раде са самопоуздањем на О(н2) сложености, тако да је бесконачни контекст немогућ.





Ово погађа најтеже када:

Разговори су дуги

Документи су велики

Инструкције су сложене





The Solution: Одвојите "радни меморију" од "складиштења", као у класичним рачунарима. Ваш агент треба да се бави спољном меморијом: складиштење, претраживање, сумирање и ажурирање знања изван самог модела.





Common approaches:

Меморија Бафер: чува последње к поруке. Брзо прототип, али губи старије информације и не скалира.

Сажетак меморије: компресује историју како би се више уклопила у контекст. Штеди токене, али ризикује искривљивање и губитак нијансе.

RAG (Retrieval-Augmented Generation): preuzima znanje iz spoljnih baza podataka. Skalan, svež i proverljiv, ali složeniji i osetljiviji na latentnost.

Графови знања: структуриране везе између чињеница и ентитета. Елегантан и објашњив, али сложен и висока баријера за улазак.





Your Checklist:

Сва историја разговора се чува изван поруке и доступна је.

Извори знања су регистровани и поновљиви.

Историја може да расте на неодређено време без ударања граница контекстног прозора.

3 – Učinite model zamenljivim

Problem: ЛЛМ-ови се брзо развијају: ОпенАИ, Гоогле, Антхропиц и други стално ажурирају своје моделе. Као инжењери, желимо да брзо искористимо ова побољшања.





Solution:

Користите модел_ид параметар у конфигурацијама или променљивим окружењима да бисте одредили који модел да користите.

Изградите апстрактне интерфејсе или класе омотача који разговарају са моделима кроз јединствени АПИ.

Опционо, пажљиво примените слојеве средњег материјала (рамкови долазе са компромисима).





Checklist:

Промена модела не прекида ваш код или утиче на друге компоненте као што су меморија, оркестрација или алати.

Додавање новог модела значи само ажурирање конфигурације и, ако је потребно, додавање једноставног слоја адаптера.

Пребацивање модела је брзо и беспрекорно - идеално подржава било који модел, или барем лако пребацује у породици модела.

4 - Један агент, многи канали

Problem: Чак и ако ваш агент почне са једним интерфејсом (на пример, УИ), корисници ће ускоро желети више начина за интеракцију: Слацк, ВхатсАппп, СМС, можда чак и ЦЛИ за дебаггирање.





Solution: Креирајте јединствени уговор о уносу, АПИ или универзални интерфејс у који се уносе сви канали. Држите логику специфичну за канал одвојено од језгра агента.





Checklist:

Агент ради преко ЦЛИ, АПИ, УИ или било ког другог интерфејса

All inputs funnel through a single endpoint, parser, or schema

Сваки интерфејс користи исти формат улаза

Ниједна пословна логика не живи у било ком адаптеру канала

Додавање нових канала значи само писање адаптера - без промјена кода кључног агента

Део 2 - Пређите изван чатбот мода

Иако постоји само један задатак, све је једноставно, као у постовима АИ утицајника.Али чим додате алате, логику доношења одлука и више фаза, агент се претвара у неред.





Губи траг, не зна шта да ради са грешкама, заборавља да позове праву алатку, а ви сте поново остали сами са дневницима, где "добро, све изгледа да је написано тамо."





Да би се то избегло, агенту је потребан јасан модел понашања: шта ради, који алати има, ко доноси одлуке, како људи интервенишу и шта да раде када нешто крене наопако.





Овај одељак покрива пет кључних принципа који ће вам помоћи да преместите свог агента изван једноставног чатбота, изградите кохерентан модел понашања који може поуздано користити алате, управљати грешкама и извршити сложене задатке.





5 - Дизајн за употребу алата

Problem: Можда звучи очигледно, али многи агенти се и даље ослањају на "Плаин Промптинг + сирови ПЛМ излаз анализирања." То је као да покушава да поправи мотор аутомобила насумично окретање вијци.

Брзост: Мала промена у редоследу речи или фраза може прекинути ваше анализирање, стварајући константну трку у наоружању између вашег кода и непредвидљивости модела.

Нејасност: Природни језик је нејасан. „Позови Џона Смита.“ Који Џон Смит?

Комплексност одржавања: Парсинг код постаје замагљен и тешко дебугирати.Сваки нови агент "вештина" значи писање више правила парсинга.

Ограничене могућности: Тешко је поуздано позвати више алата или проћи сложене структуре података преко обичног текста.





Solution: Let the model return JSON (or another structured format), and let your system handle the execution. This means the LLMs interpret user intent and decide Štaда уради, а ваш код брине оKakoто се дешава, извршавајући праву функцију преко добро дефинисаног интерфејса.





Већина провајдера (ОпенАИ, Гоогле, Антхропиц, итд.) сада подржаваfunction callingилиstructured output:

Дефинишете своје алате као ЈСОН шеме са именом, описом и параметрима.Описи су кључни јер се модел ослања на њих.

Сваки пут када позовете модел, пружате му ове шеме алата уз позив.

Модел враћа ЈСОН који одређује: (1) функцију за позив, (2) параметре према шеми

Ваш код потврђује ЈСОН и позива на исправну функцију са овим параметрима.

Опционално, излаз функције може се вратити у модел за коначну генерацију одговора.





Important: Opisi alata su deo uputstva. Ako su nejasni, model može da izabere pogrešan alat. Šta ako vaš model ne podržava poziv funkcije ili želite da ga izbegnete?





Замолите модел да произведе ЈСОН излаз путем инстант инжењеринга и потврдите га са библиотекама као што је Пидантик.





Checklist:

Одговори су строго структурирани (на пример, ЈСОН)

Интерфејси алата су дефинисани шемама (ЈСОН Сцхема или Пидантик)

Излаз се валидира пре извршења

Грешке у формату не прекидају систем (смешно управљање грешкама)

ЛЛМ одлучује коју функцију да позове, код се бави извршењем

6 - Ставите контролну логику у код

Problem:Већина агента данас се понаша као цхатботи: корисник каже нешто, агент одговара.





Са овим подешавањем, ваш агент не може:

Делује самостално без корисничког позива

Радите задатке паралелно

План и секвенца више корака

Retry neuspešno korake inteligentno

Rad u pozadini





Ona postaje reaktivna umesto proaktivna.What you really want is an agent that thinks like a schedulerOnaj koji gleda na posao koji je pred njim, izračunava šta da uradi sledeće i kreće napred bez čekanja da bude pokovan.





То значи да ваш агент треба да буде у стању да:

Узмите иницијативу

Везати више корака заједно

Recover from failure

Prebacivanje između zadataka

Nastavite da radite, čak i kada niko ne gleda





Solution: Move the control flow out of the LLM and into your system. The model can still help (e.g., decide which step comes next), but the actual sequencing, retries, and execution logic should live in code.





This flips your job from Брзо инжењерстводваsystem design. The model becomes one piece of a broader architecture, not the puppet master.





Let’s break down three ways teams are approaching this shift.





1. Finite State Machine (FSM)

Шта је то: Раздвојите задатак у дискретна стања са дефинисаним транзицијама.

LLM role: Acts within a state or helps pick the next one.

Best for: Linear, predictable flows.

Предности: Једноставно, стабилно, лако се дебитује.

Tools: StateFlow, YAML configs, classic state pattern in code.





2. Directed Acyclic Graph (DAG)

What it is: Represent tasks as a graph — nodes are actions, edges are dependencies.

LLM role: Acts as a node or helps generate the graph.

Best for: Branching flows, parallel steps.

Pros: Flexible, visual, good for partial recomputation.

Tools: LangGraph, Trellis, LLMCompiler, or DIY with a graph lib.





3. Planner + Executor

What it is: One agent (or model) builds the plan; others execute it step by step.

LLM role: Big model plans, small ones (or code) execute.

Best for: Modular systems, long chains of reasoning.

Pros: Separation of concerns, scalable, cost-efficient.

Tools: LangChain’s Plan-and-Execute, or your own planner/executor architecture.





Why This Matters

Добијате контролу над понашањем агента

Можете ретри, дебаг и тестирати појединачне кораке

Можете скалирати делове независно или заменити моделе

You make things visible and traceable instead of opaque and magical





Checklist

Агент прати структуру ФСМ, ДАГ или Планер

LLM suggests actions but doesn’t drive the flow

You can visualize task progression

Управљање грешкама је печено у логику протока

7 — Keep a Human in the Loop

Problem:Чак и са алатима, протоком контроле и структурираним излазима, пуна аутономија је и даље мит.RazumevanjeNe mogu da budu odgovorni.I u stvarnom svetu, oni će napraviti pogrešan poziv (pre ili kasnije).





When agents act alone, you risk:

Nepovratne greške: brisanje zapisa, poruka pogrešnoj osobi, slanje novca mrtvom novčaniku.

Compliance issues : violating policy, law, or basic social norms.

: violating policy, law, or basic social norms. Weird behavior: skipping steps, hallucinating actions, or just doing something no human ever would.

skipping steps, hallucinating actions, or just doing something no human ever would. Broken trust : users won’t rely on something that seems out of control.

: users won’t rely on something that seems out of control. Нема одговорности: када се разбије, није јасно шта је пошло наопако или ко поседује неред.





Solution: Bring Humans Into the Loop (HITL)

Treat the human as a co-pilot, not a fallback. Design your system to pause,Питај, илиПут decisions to a person when needed. Not everything should be fully automatic. Sometimes, “Are you sure?” is the most valuable feature you can build.





Ways to Include Humans

Approval gates: Critical or irreversible actions (e.g., sending, deleting, publishing) require explicit human confirmation.

Critical or irreversible actions (e.g., sending, deleting, publishing) require explicit human confirmation. Escalation paths: When the model’s confidence is low or the situation is ambiguous, route to a human for review.

When the model’s confidence is low or the situation is ambiguous, route to a human for review. Интерактивна корекција: Дозволите корисницима да прегледају и уређују одговоре модела пре него што буду послати.

Повратне везе: Ухватити људске повратне информације како би се побољшало понашање агената и обучили модели током времена (Унапређење учења из људских повратних информација).

Override options: Enable humans to interrupt, override, or re-route the agent’s workflow.





Checklist

Осетљиве акције потврђује човек пре извршења

Постоји јасан пут за ескалацију сложених или ризичних одлука

Users can edit or reject agent outputs before they’re final

Logs and decisions are reviewable for audit and debugging

The agent explains why it made a decision (to the extent possible)

8 - Храњење грешака назад у контекст

Problem:Већина система се сруши или заустави када се деси грешка.За аутономног агента, то је мртав крај.Али слепо игнорисање грешака или халуцинација око њих је једнако лоше.





What can go wrong:

Brittleness: Any failure, whether an external tool error or unexpected LLM output, can break the entire process.

Any failure, whether an external tool error or unexpected LLM output, can break the entire process. Inefficiency: Frequent restarts and manual fixes waste time and resources.

Frequent restarts and manual fixes waste time and resources. No Learning: Without awareness of its own errors, the agent can’t improve or adapt.

Without awareness of its own errors, the agent can’t improve or adapt. Halucinacije: Greške koje se ne rešavaju mogu dovesti do lažnih ili izmišljenih odgovora.





Solution:Укључите их у напомене или меморију тако да агент може покушати само-корекцију и прилагодити своје понашање.





How it works:

Understand the error: Capture error messages or failure reasons clearly. Self-correction: The agent reflects on the error and tries to fix it by: (1) detecting and diagnosing the issue, (2) adjusting parameters, rephrasing requests, or switching tools, (3) retrying the action with changes. Error context matters: Detailed error info (like instructions or explanations) helps the agent correct itself better. Even simple error logs improve performance. Training for self-correction: Incorporate error-fix examples into model training for improved resilience. Human escalation: If self-correction repeatedly fails, escalate to a human (see Principle 7).





Checklist:

Грешке из претходних корака се чувају и уносе у контекст

Retry logic is implemented with adaptive changes

Поновљени неуспјеси изазивају повратак на људски преглед или интервенцију

9 — Split Work into Micro-Agents

Problem:Што је задатак већи и мешавији, дужи прозор контекста, а вероватније је да ће ЛЛМ изгубити заплет.Сложени токови рада са десетинама корака гурају модел преко своје слатке тачке, што доводи до конфузије, изгубљених токена и ниже тачности.





Solution:Подијелите и освојите. користитеsmall, purpose-built agents, each responsible for one clearly defined job. A top-level orchestrator strings them together.





Why small, focused agents work

Manageable context : shorter windows keep the model sharp.

: shorter windows keep the model sharp. Јасно власништво: један агент, један задатак, нула двосмислености.

Veća pouzdanost: jednostavniji tokovi znače manje mesta za gubljenje.

Лакше тестирање: можете јединично тестирати сваког агенса у изолацији.

Faster debugging: when something breaks, you know exactly where to look.





There’s no magic formula for when to split logic; it’s part art, part experience, and the boundary will keep shifting as models improve. A good rule of thumb: if you can’t describe an agent’s job in one or two sentences, it’s probably doing too much.





Checklist

Ukupan tok posla je serija mikro-agentskih poziva.

Each agent can be restarted and tested on its own.

Definiciju agenta možete objasniti u 1-2 rečenice.

Part 3 – Stabilize Behavior

Most agent bugs don’t show up as red errors; they show up as weird outputs. A missed instruction. A half-followed format. Something that almost works… until it doesn’t.





That’s because LLMs don’t read minds. They read tokens.





Начин на који оквирате захтеве, оно што преносите у контекст и како пишете позиве, све то директно обликује резултат. И свака грешка у том подешавању постаје невидљива грешка која чека да се касније појави.if you’re not careful, every interaction slowly drifts off course.





Овај одељак је о затезању те петље за повратне информације. Промптс нису бацане нити, они су код. Контекст није магија, то је стање које експлицитно управљате.





10 — Treat Prompts as Code

Problem:Превише пројеката третира напомене као једнократне нити: хардцодиране у Питхон датотекама, расуте широм базе кода, или нејасно бачене у Нотион.

Тешко је пронаћи, ажурирати или чак разумети шта сваки позив ради

There’s no version control — no way to track what changed, when, or why

Оптимизација постаје претпоставка: нема повратних информација, нема А / Б тестирања

And debugging a prompt-related issue feels like trying to fix a bug in a comment





Solution: Prompts areОни дефинишу понашање. тако да их управљају као да бисте прави код:

Одвојите их од ваше логике: чувајте их у txt, .md, .yaml, .json или користите шаблоне као што су Jinja2 или BAML

Верзија их са својим репо (као и функције)

Test them: (1) Unit-test responses for format, keywords, JSON validity, (2) Run evals over prompt variations, (3) Use LLM-as-a-judge or heuristic scoring to measure performance





Bonus:Tretirajte prompt recenzije kao kod recenzije.Ako promena može da utiče na ponašanje izlaza, zaslužuje drugi set očiju.





Checklist:

Промптс живе изван вашег кода (и јасно су именовани)

Они су верзионисани и диффабле

Они су тестирани или оцењени

They go through review when it matters

11 — Engineer the Context Stack

Problem: We’ve already tackled LLM forgetfulness by offloading memory and splitting agents by task. But there’s still a deeper challenge: howФорматирамо и доставимо информације моделу.





Most setups just throw a pile of role: content messages into the prompt and call it a day. That works… until it doesn’t. These standard formats often:

Burn tokens on redundant metadata

Struggle to represent tool chains, states, or multiple knowledge types

Fail to guide the model properly in complex flows





And yet, we still expect the model to “just figure it out.” That’s not engineering. That’s vibes.





Solution: Engineer the context.

Третирајте цео улазни пакет као пажљиво дизајниран интерфејс, јер је то управо оно што јесте.









Here’s how:

Властите комплетан стек: Контролишите шта улази, како се наручује и где се појављује.Све од системских упутстава до примљених докумената до меморијских уноса треба да буде намерно.

Go beyond chat format : Build richer, denser formats. XML-style blocks, compact schemas, compressed tool traces, even Markdown sections for clarity.

: Build richer, denser formats. XML-style blocks, compact schemas, compressed tool traces, even Markdown sections for clarity. Razmislite holistički: Kontekst = sve što model vidi: uputstvo, stanje zadataka, prethodne odluke, logovi alata, uputstva, čak i prethodni izlazi.





This becomes especially important if you’re optimizing for:

Густина информација: паковање више значења у мање токена

Cost efficiency: high performance at low context size

high performance at low context size Security: controlling and tagging what the model sees

controlling and tagging what the model sees Error resilience: explicitly signaling edge cases, known issues, or fallback instructions





Bottom line:Помоћ је само пола битке.Context engineeringИ ако то још не радите, бићете када ваш агент одрасте.

12 - Додајте сигурносне слојеве

Чак и са чврстим позивима, меморијом и протоком контроле, агент и даље може изаћи из редова. Размислите о овом принципу као осигурању против најгорих сценарија:

Prompt injection: users (or other systems) slip in instructions that hijack the agent.

users (or other systems) slip in instructions that hijack the agent. Sensitive-data leaks: the model blurts out PII or corporate secrets.

the model blurts out PII or corporate secrets. Toxic or malicious content: unwanted hate speech, spam, or disallowed material.

unwanted hate speech, spam, or disallowed material. Hallucinations: confident but false answers.

confident but false answers. Akcije izvan okvira: agent „dobije kreativnost“ i radi nešto što nikada ne bi trebalo da uradi.





Ниједна поправка не покрива све то.defense-in-depth: више заштитних мера које хватају проблеме у свакој фази циклуса захтева / одговора.





Quick Checklist

User input validation is in place (jailbreak phrases, intent check).

is in place (jailbreak phrases, intent check). For factual tasks, answers must reference RAG context .

. Помоћ експлицитно говори моделу да се држи примљених чињеница.

Излазни филтер блокира ПИИ или забрањени садржај.

Одговори укључују цитат / линк на извор.

Agent and tools follow the least privilege .

. Критичне акције пролазе кроз ХИТЛ одобрење или праћење.





Третирајте ове слојеве као стандардне ДевоПс: пријавите их, тестирајте их и не успејте безбедно.

Part 4 - Keep it Working Under Load

У производњи, неуспјеси се ретко дешавају одједном, а често их не примећујете одмах, понекад уопште.





This section focuses on building the engineering discipline to monitor your agent continuously, ensuring everything runs smoothly. Од дневника и праћења до аутоматизованих тестова, ове праксе чине понашање вашег агента јасним и поузданим, без обзира да ли активно гледате или се фокусирате на изградњу следећег пробоја.





13 — Trace the Full Execution Path

Problem: Агенти ће се неизбежно понашати погрешно током развоја, ажурирања или чак нормалног рада. Дебугирање ових проблема може потрошити безброј сати покушавајући да репродукује грешке и идентификује неуспјехе. Ако сте већ имплементирали кључне принципе као што су држање државе ван и компресирање грешака у контекст, ви сте испред.





Solution: Log the entire journey from the user request through every step of the agent’s decision and action process. Individual component logs aren’t enough; you need end-to-end tracing covering every detail.





Why this matters:

Дебаггирање: Брзо идентификује где и зашто су ствари пошло наопако.

Аналитика: Откријте препреке и могућности за побољшање.

Процена квалитета: Мери како промене утичу на понашање.

Reproducibility : Recreate any session precisely.

: Recreate any session precisely. Аудирање: Чувати пуну евиденцију одлука и акција агента.





Minimum data to capture

Input : User request and parameters from prior steps.

: User request and parameters from prior steps. Agent state : Key variables before each step.

: Key variables before each step. Помоћ: Пуна порука послата на ЛЛМ (упутства за систем, историја, контекст).

LLM output : Raw response before processing.

: Raw response before processing. Tool call : Tool name and parameters invoked.

: Tool name and parameters invoked. Tool result : Tool output or error.

: Tool output or error. Одлука агента: Следећи кораци или одабрани одговори.

Metadata: Timing, model info, costs, code, and prompt versions.





Када је могуће, користите постојеће алате за праћење: ЛангСмитх, Аризе, Тежине и предрасуде, ОпенТелеметрија итд.





Checklist:

Сви кораци су забележени са свим детаљима.

Логови повезани са session_id и step_id.

Интерфејс за преглед пуних позивних ланца.

Способност да у потпуности репродукује било који промпт у било ком тренутку.

14 - Тестирање сваке промене

Problem: До сада, ваш агент се можда осећа спремним за покретање: ради, можда чак и тачно како сте желели. али како можете бити сигурни да ће наставити да ради након ажурирања? Промене у коду, скуповима података, базним моделима или позивима могу тихо прекинути постојећу логику или погоршати перформансе.Традиционалне методе тестирања не покривају све чуда ЛЛМ-а:

Моделски дрифт: перформансе се смањују током времена без промене кода због промена модела или података

Брза крхкост: мала прилагођавања пријема могу изазвати велике промене у излазу

Недетерминизам: ЛЛМс често дају различите одговоре на исти улаз, компликујући тестове тачног подударања

Грешке које је тешко репродуковати: чак и са фиксним уносима, грешке могу бити тешке за праћење

Ефекат лептира: промена каскаде непредвидиво преко система

Халуцинације и други ризици специфични за ЛЛМ





SolutionУсвојите темељну, вишеслојну стратегију тестирања која комбинује класичне софтверске тестове са контролама квалитета фокусираним на ЛЛМ:

Multi-level testing : unit tests for functions/prompts, integration tests, and full end-to-end scenarios

: unit tests for functions/prompts, integration tests, and full end-to-end scenarios Фокус на квалитет ЛЛМ излаза: релевантност, кохерентност, тачност, стил и сигурност

Користите златне скупове података са очекиваним излазима или прихватљивим опсеговима резултата за контролу регресије

Аутоматизовати тестове и интегрисати их у ЦИ / ЦД цевоводе

Involve humans for critical or complex evaluations (human-in-the-loop)

for critical or complex evaluations (human-in-the-loop) Итеративно тестирање и рафинирање позива пре распореда

Testiranje na različitim nivoima: komponente, promptovi, lanci/agenti i kompletni tokovi posla





Checklist:

Логика је модуларна и темељно тестирана појединачно и у комбинацији

Output quality is evaluated against benchmark data

Тестови покривају уобичајене случајеве, случајеве ивице, неуспјехе и злонамерне улазе

Осигурана је чврстоћа против бучних или непријатељских улаза

Све промене пролазе аутоматске тестове и надгледају се у производњи како би се откриле непримећене регресије

15 — Own the Whole Stack

Овај принцип све повезује, то је мета-правило које пролази кроз све остале.





Данас постоје безбројни алати и оквири за руковање готово било којим задатком, што је одлично за брзину и лакоћу прототипирања - али то је такође замка.





Ово је посебно важно у развоју агената, где морате управљати:

Инхерентна непредвидљивост ЛЛМ-а

Комплексна логика око транзиција и само-корекције

Potreba da se vaš sistem prilagodi i razvija bez prepisivanja osnovnih zadataka





Frameworks often invert control: они диктирају како би се ваш агент требао понашати. Ово може убрзати прототипирање, али чини дугорочни развој тежим за управљање и прилагођавање.





Многи принципи које сте видели могу се имплементирати помоћу офф-тхе-схелф алата, али понекад, изградња основне логике експлицитно захтева сличан напор и даје вам много бољу транспарентност, контролу и прилагодљивост.





С друге стране, пуно прилагођавање и преиспитивање свега од нуле је превише инжењерско и једнако ризично.





Ključ jebalanceКао инжењер, ви свесно одлучујете када се ослонити на оквире и када да преузме пуну контролу, у потпуности разуме компромисе укључене.





RememberMnoge aktuelne alate su izgrađene pre nego što su standardi postali čvrsti.Možda će sutra postati zastareli – ali arhitektonski izbori koje sada donosite ostaće daleko duži.

Закључак

Изградња агента ЛЛМ-а више није само о позивању АПИ-ја.Ово је о дизајнирању система који може да се носи са стварним нередностима: грешкама, статусом, контекстним ограничењима, неочекиваним уносима и еволуционим захтевима.





The 15 principles we covered aren’t theory, they’re battle-tested lessons from the trenches. They’ll help you turn fragile scripts into stable, scalable, and maintainable agents that don’t break the moment real users show up.





Сваки принцип заслужује разматрање да би се утврдило да ли се уклапа у ваш пројекат. На крају, то је ваш пројекат, ваши циљеви и ваша креација. Али запамтите: ЛЛМ је моћан, али то је само један део сложеног система. Ваш посао као инжењер је да поседујете процес, управљате сложеношћу и држите целу ствар глатко.





If you take away one thing, let it be this: slow down, build solid foundations, and plan for the long hauЈер то је једини начин да се пређе са “вау, то је одговорио!” на “да, то наставља да ради.”





Nastavite da iterirate, testirate i učite.I ne zaboravite, ljudi u ćošku nisu padobran, oni održavaju vaš agens osnovan i efikasan.





Ово није крај.То је само почетак грађевинских агента који заправо испоручују.

