Introduction Introduktion Lad os være ærlige: rejsen ser næsten den samme ud for alle. I starten åbner du ChatGPT og tænker: Et par linjer tekst og pludselig får du kode, en markedsføring forvirring, eller endda en opskrift forslag. “Wow, det er magisk!” Så kommer næste fase. Magien langsomt bliver til kaos. Prompts bliver længere, workarounds stable op, du begynder at kæde opkald sammen - og en dag indser du: "Okay, jeg bruger mere tid på at forklare modellen, hvad jeg har brug for, end jeg faktisk gør opgaven selv." Det er, når du indser, at kaoset har brug for at tæmme, og du begynder at tænke som en ingeniør. Så lad mig spørge dig: Fortsætter med at spille rundt med opfordringer? fast i endeløse spaghetti kæder? eller måske står lige ved kanten af noget større? where are you right now on this maturity curve? I denne artikel vil jeg gå dig gennem en simpel modenhedsmodel for LLM-systemer - en rejse fra hurtige eksperimenter til fuldstændig arkitektur, hvor agenter arbejder sammen som et godt oliehold. -en tilgang, der hjælper med endelig at bryde fri fra kaoset. men før vi kommer derhen, lad os tage et ærligt kig på, hvordan de fleste projekter udvikler sig. AAC (Agent Action Chains) Why We Need a Maturity Model Hvorfor vi har brug for en modenhedsmodel Lige nu har LLM-systemer ikke en standard vækstvej. Hver udvikler eller team tager deres egen rute, prøver ud hacks, opfinder deres egne tilgange. På papiret lyder det som frihed og kreativitet. Se dig omkring: Nogle projekter stopper ved "bare tilføje en anden opfordring, og det vil fungere" -fasen. Andre bygger lange kæder af opkald, der ser godt ud på et diagram, men kollapser under den første virkelige belastning. Og så er der de kodeløse kort, der spirer ind i et mareridt af hundrede blokke forbundet i hver retning. På demo-dagen ser det stadig levende ud. Men så snart det rammer produktionen, skales intet, spores intet, og ingen kan endda fortælle, hvor tingene brød. Tusindvis af hold og startups ender med at spilde måneder på at gå den samme prøve-og-fejl-vej, genopfinde det samme hjul igen og igen. Det er her, hvor a Det giver dig et simpelt kort: hvor du er nu, og hvad der skal ændres for at komme videre. Andre felter gik igennem dette før. Agile modenhedsmodeller hjalp virksomheder med at finde ud af, om de virkelig var agile-eller bare omdøbte opgaver som "sprints." maturity model LLM-systemer er på samme vendepunkt i dag. Hypen er massiv, men modenheden er næsten nul. Uden en fælles model for fremskridt, vil vi bare fortsætte med at drukne i kaotiske prompts og spaghetti-systemer. Level 1 - The Script (Prompting Playground) Niveau 1 - Skriptet (Prompting Playground) Det er her, næsten alle starter. En opfordring i ChatGPT eller en enkelt API-opkald og boom, du har et svar. Det virker "i øjeblikket", men kun så længe du kan holde detaljerne i dit hoved. Signs. Chaotiske forespørgsler, ingen gentagelighed, uforudsigelige resultater.I dag fungerer det, i morgen modellen giver dig noget helt andet. Risks. Intet her kan integreres i et reelt produkt eller forretningsproces. When it makes sense. Hurtige eksperimenter, prototyping ideer, eller de første "wow øjeblikke", når du bare får en fornemmelse for, hvad LLMs kan gøre. Level 2 - The Complex Prompt (Prompt Engineering 2.0) Niveau 2 - Den komplekse prompt (Prompt Engineering 2.0) På dette stadium begynder folk at "give spøgelser" med tekst. En enkelt forespørgsel er ikke længere nok - så du får lange forespørgsler med rolleinstruktioner, detaljerede trin og endda mini-scenarier bagt i. Nogle gange føles det mindre som at skrive en forespørgsel og mere som at kode et lille program på engelsk. Signs. Du begynder at føle "formuleringens magi": ændre en sætning, og modellen spytter ud noget helt andet.Nogle mennesker opbygger endda hurtige biblioteker, men under det er det stadig kun en stor monolit. Risks. Efterhånden som kompleksiteten vokser, bliver opfordringen til et monster, der ikke kan vedligeholdes.At tilføje et nyt trin betyder ofte at omskrive alt.Testing er smertefuldt. When it makes sense. Komplekse opfordringer er stadig nyttige i den rigtige sammenhæng: hurtige MVP'er, markedsføringsbrugssager eller forskningsprojekter.Nogle gange leverer de et imponerende resultat "her og nu". Level 3 - The Linear Chain Niveau 3 - Den lineære kæde Næste skridt efter "gigant prompt" er at forbinde flere LLM opkald i en sekvens. nu er systemet ikke en massiv blok af tekst - det er en række trin: udtræk dataene, behandle det, og derefter generere et svar baseret på det. Signs. På dette stadium begynder de første arbejdsprocesser at dukke op – hvad enten det er i LangChain, n8n eller Make.com. Folk begynder at tænke i trin, bryder store problemer ned i underopgaver. Det er allerede meget bedre end en kæmpe monolit af en prompt - men det er stadig strengt lineært, uden forgrening eller fleksibilitet. "Først klassificere, derefter hente kontekst, så generere svaret." Risks. Det største problem er stivhed. Disse kæder er hugget i sten: skift et skridt, og du ender ofte med at omskrive alt andet. Tilføjelse af nye scenarier er smertefuldt, og fejl har tendens til at bryde hele kæden på én gang. When it makes sense. Dette niveau fungerer fint for små bots eller simple automatiseringer: analysering af e-mails, generering af resuméer, udarbejdelse af hurtige svar. Det er et godt udgangspunkt. Men i ethvert ægte produkt bliver det hurtigt en begrænsning. Level 4 - Spaghetti (Ad-hoc Systems) Niveau 4 - Spaghetti (Ad-hoc systemer) Det er her, den virkelige smerte begynder.Når en simpel lineær kæde ikke længere fungerer, begynder udviklerne at stable på "grene" og "if-else" betingelser. Temporær hukommelse vises - nogle gange er det bare et array i kode, nogle gange en brugerdefineret lagring hack, nogle gange en variabel, der passeres klodset mellem knudepunkter. Signs. Arbejdsprocesser i kodeløse platforme begynder at ligne edderkoppewebs: snesevis af knudepunkter, forvirrede forbindelser, buer overalt. Kodebaserede projekter er ikke meget bedre: logik spredt på tværs af opfordringer og hjælperfunktioner, med kritiske forhold skjult lige inde i teksten af opfordringerne selv. Risks. Disse systemer er et mareridt at vedligeholde. Det er næsten umuligt. Fejl er skjult, fejlfinding er ikke-eksisterende, og alt afhænger af den ene person, der "ved, hvordan det fungerer." Hvor When it makes sense. Ærligt? aldrig. Spaghetti-systemer dukker normalt op som et biprodukt af eksperimentering, men at blive her dræber vækst. Mange teams ramte dette stadium og indser endelig: løsningen er ikke "bare en mere hack"-det er den virkelige arkitektur. Level 5 - Orchestrator + Roles (System Design Thinking) Niveau 5 - Orchestrator + Roles (System Design Thinking) Dette er det stadium, hvor kaos endelig bliver til et system. I stedet for en endeløs kæde eller en spaghetti rod af grene, får du en Hver del af systemet kender sin opgave: structured design with clearly defined roles. - the brain that decides who does what and in what order. Orchestrator - narrow experts, each handling a specific task: classification, response generation, data retrieval. Specialists - makes sure the system isn’t living like a goldfish, giving it access to past context and knowledge. Memory - catches errors and ensures resilience, so one failure doesn’t bring everything down. Guard - monitors execution, collects logs, and provides visibility. Observer - polishes the final output and delivers it to the next stage. Egress Signs. På dette niveau ser du formelle kontrakter (ofte JSON) der forbinder roller. Du kan teste komponenter individuelt, bytte eller udvide dem uden at bryde hele systemet. Risks. Du er nødt til at tænke arkitektonisk, designe roller, og modstå trangen til bare at "smide ind i en anden prompt." When it makes sense. Produktionsmiljøer, forretningsprocesser og produkter i den virkelige verden. Alt ud over eksperimenter skal til sidst udvikle sig til dette stadium. Og det er præcis, hvor kommer i den arkitektur, jeg udviklede som en praktisk modenhedsmodel for LLM-systemer. AAC formaliserer rollerne, tilføjer disciplin og muliggør det afgørende spring fra "hurtig hacking" til ægte teknik. AAC (Agent Action Chains) How to Use This Model Hvordan man bruger denne model Den virkelige værdi af en modenhedsmodel er, at den fungerer som et spejl. Det giver dig mulighed for at tage et ærligt kig på dit projekt, se, hvor du er, og finde ud af, hvad der skal ændres for at komme videre. For self-assessment. Hvis du bygger noget alene eller i et lille team, er modellen grundlæggende en hurtig tjekliste. Det snapshot hjælper dig med at spotte morgendagens flaskehalse i dag - og forberede dem på forhånd. “Liver vi stadig i fastlandet? har vi bygget enkle kæder? eller er vi allerede druknet i spaghetti?” For teams. En produktchef, en ingeniør og en analytiker behøver ikke at gå tabt i tekniske detaljer - de kan bare navngive niveauet. - og alle ved præcis, hvad det betyder. Mindre friktion, mere produktive samtaler. "Vi er i kædefasen, men vi skal flytte forbi spaghetti ASAP" For investors and partners. Modellen fungerer også som et signal om holdets modenhed. En startup, der stadig arbejder med rå opfordringer, kan levere flashy demos, sikkert - men det er en risikabel indsats. Et team, der allerede tænker i form af roller, orkestrering og observabilitet, dog? Udviklingen af LLM-systemer følger den samme bue som enhver teknologi: Først kommer magien, så kaoset og endelig - teknikken. Vi starter med enkle scripts, bliver fanget i komplekse opfordringer, forsøger at kæde ting sammen, drukner i spaghetti ... og først derefter indser: det er tid til at opbygge arkitektur. En modenhedsmodel hjælper os med at konfrontere den virkelighed: at se, hvor vi er, og at vide, hvor vi skal gå næste. For nogle betyder det at slippe af med "monster-prompts." For andre betyder det at undslippe fælden i kaotiske kæder. Det er hvor kommer ind i billedet - en arkitektur, der formaliserer dette øverste niveau af modenhed. Men AAC er ikke magi. Det er resultatet af at gå stien. AAC (Agent Action Chains) Her er AAC system design mønster, hvis du ønsker at dykke dybere. Her er AAC system design mønster, hvis du ønsker at dykke dybere.