Introduction Wprowadzenie Bądźmy szczerzy: podróż wygląda prawie tak samo dla wszystkich. Na początku otwierasz ChatGPT i myślisz: Kilka wierszy tekstu i nagle masz kod, zaburzenia marketingowe lub nawet sugestię na receptę. „Wow, to jest magia!” Następnie następuje kolejna faza. Magia powoli zamienia się w chaos. Prompts stają się dłuższe, workarounds gromadzą się, zaczynasz łańcuch połączeń razem-i pewnego dnia zdajesz sobie sprawę: "Dobrze, spędzam więcej czasu wyjaśniając modelowi, czego potrzebuję, niż faktycznie wykonując sam zadanie." Trzecim etapem jest to, że rzeczy wreszcie stają się interesujące.To wtedy zdajesz sobie sprawę, że chaos potrzebuje przytłaczania, a zaczynasz myśleć jak inżynier.Nie jako ktoś przytłaczający się zabawką, ale jako architekt, który buduje system. Pozwólcie mi więc zapytać Was: Wciąż bawi się z prośbami? utknął w niekończących się łańcuchach spaghetti? lub być może stojąc na krawędzi czegoś większego? where are you right now on this maturity curve? W tym artykule chcę przejść przez prosty model dojrzałości dla systemów LLM - podróż od szybkich eksperymentów do pełnowartościowej architektury, w której agenci pracują razem jak dobrze zaopatrzony zespół. - podejście, które pomaga wreszcie uwolnić się od chaosu. ale zanim tam dotrzemy, przyjrzyjmy się szczerze, jak rozwija się większość projektów. AAC (Agent Action Chains) Why We Need a Maturity Model Dlaczego potrzebujemy modelu dojrzałości W tej chwili systemy LLM nie mają standardowej ścieżki wzrostu. Każdy deweloper lub zespół podejmuje własną ścieżkę, próbując haczyków, wymyślając własne podejścia. Na papierze brzmi to jak wolność i kreatywność. Rozejrzyj się: niektóre projekty zatrzymują się na etapie „tylko dodaj kolejną prośbę, a to zadziała”. Inne budują długie łańcuchy połączeń, które wyglądają ładnie na wykresie, ale upadają pod pierwszym rzeczywistym obciążeniem. A potem są mapy bez kodu, które spiralnie zamieniają się w koszmar stu bloków połączonych w każdym kierunku. W dniu demonstracji nadal wygląda żywo. Dziesiątki zespołów i start-upów kończą się marnowaniem miesięcy chodzenia tą samą ścieżką prób i błędów, ponownie wymyślając to samo koło ponownie i ponownie. To tam, gdzie a Dostarcza Ci prostą mapę: gdzie jesteś teraz i co musi się zmienić, aby przejść do przodu. Inne pola przeszły to wcześniej. Modele dojrzałości Agile pomogły firmom dowiedzieć się, czy rzeczywiście były to agile-lub po prostu zmieniły nazwę zadań jako „sprints”. maturity model Systemy LLM są w tym samym punkcie zwrotnym dzisiaj. Hype jest ogromny, ale dojrzałość jest prawie zero. Level 1 - The Script (Prompting Playground) Poziom 1 - The Script (Prompting Playground) To jest miejsce, w którym zaczyna się prawie każdy. Jedno wezwanie w ChatGPT lub pojedyncze połączenie API i boom, masz odpowiedź. to działa "w tej chwili", ale tylko tak długo, jak możesz zachować szczegóły w swojej głowie. Signs. Chaotyczne zapytania, brak powtarzalności, nieprzewidywalne wyniki.Dziś to działa, jutro model daje coś zupełnie innego. Risks. Zero kontroli. Nic tutaj nie może być zintegrowane z rzeczywistym produktem lub procesem biznesowym. When it makes sense. Szybkie eksperymenty, prototypowanie pomysłów lub te pierwsze "wow momenty", gdy po prostu masz poczucie tego, co LLM może zrobić. Level 2 - The Complex Prompt (Prompt Engineering 2.0) Poziom 2 - Kompleksowy Prompt (Inżynieria Prompt 2.0) Na tym etapie ludzie zaczynają „rzucać zaklęcia” tekstem.Jedno zapytanie nie wystarcza już – więc otrzymasz długie zaproszenia z instrukcjami dotyczącymi ról, szczegółowymi krokami, a nawet mini-scenariuszami. Signs. Zaczynasz odczuwać „magie sformułowania”: zmieniaj jedną frazę, a model wypłukuje coś zupełnie innego.Niektórzy ludzie nawet budują biblioteki, ale pod tym, to nadal tylko jeden duży monolit. Risks. W miarę wzrostu złożoności prośba zamienia się w potwora, którego nie można utrzymać. Dodawanie nowego kroku często oznacza ponowne zapisanie wszystkiego. Testowanie jest bolesne. skalowanie tego podejścia? Niemal niemożliwe. When it makes sense. Kompleksowe wskazówki są nadal przydatne w odpowiednim kontekście: szybkie MVP, przypadki użycia w marketingu lub projekty badawcze. Czasami dostarczają imponującego wyniku „tu i teraz”. Level 3 - The Linear Chain Poziom 3 – łańcuch liniowy Następnym krokiem po "gigantowym wezwaniu" jest połączenie wielu połączeń LLM w sekwencji. Teraz system nie jest jednym masywnym blokem tekstu - jest to seria kroków: wyodrębnij dane, przetwórz je, a następnie wygeneruj odpowiedź na tej podstawie. Signs. Na tym etapie zaczynają pojawiać się pierwsze przepływy pracy – czy to w LangChain, n8n, czy Make.com. Ludzie zaczynają myśleć krok po kroku, dzieląc duże problemy na podzadanie. Jest już o wiele lepszy niż jeden gigantyczny monolit prompt, ale nadal jest ściśle liniowy, bez rozgałęzień i elastyczności. „Najpierw klasyfikuj, potem odbierz kontekst, a następnie wygeneruj odpowiedź.” Risks. Największym problemem jest sztywność. łańcuchy te są rzeźbione w kamieniu: zmiana jednego kroku, a często kończy się ponownym napisaniem wszystkiego innego. Dodawanie nowych scenariuszy jest bolesne, a błędy mają tendencję do zerwania całego łańcucha na raz. When it makes sense. Ten poziom działa dobrze dla małych botów lub prostych automatyzacji: analizowanie wiadomości e-mail, generowanie streszczeń, sporządzanie szybkich odpowiedzi. Jest to dobry punkt wyjścia. Level 4 - Spaghetti (Ad-hoc Systems) Poziom 4 - Spaghetti (systemy ad hoc) Tutaj zaczyna się prawdziwy ból.Kiedy prosty łańcuch liniowy przestaje działać, deweloperzy zaczynają gromadzić się na warunkach „oddziałów” i „jeśli tak”.Pamięć tymczasowa pojawia się – czasami jest to tylko arytmia w kodzie, czasami niestandardowy hack pamięci masowej, czasami zmienna przechodzi nieporęcznie między węzłami. Signs. Przepływy pracy na platformach bez kodu zaczynają wyglądać jak pajączki: dziesiątki węzłów, zakłócone połączenia, pętle wszędzie. Projekty oparte na kodzie nie są o wiele lepsze: logika rozproszona po zaproszeniach i funkcjach pomocniczych, z krytycznymi warunkami ukrytymi wewnątrz samego tekstu zaproszeń. Risks. Te systemy są koszmarem do utrzymania.Kiedy coś pęknie, Jest to niemal niemożliwe. błędy są ukryte, debugowanie nie istnieje, a wszystko zależy od tej jednej osoby, która „wie, jak to działa”. gdzie When it makes sense. Szczerze? nigdy. systemy spaghetti zwykle pojawiają się jako produkt uboczny eksperymentów, ale pobyt tutaj zabija wzrost. Wiele zespołów dotarło do tego etapu i wreszcie zdają sobie sprawę: rozwiązanie nie jest „tylko kolejnym hakowaniem” – jest to prawdziwa architektura. Level 5 - Orchestrator + Roles (System Design Thinking) Poziom 5 - Orchestrator + Roles (myślenie o projektowaniu systemów) Jest to etap, w którym chaos ostatecznie zamienia się w system. Zamiast jednego niekończącego się łańcucha lub spaghetti chaosu gałęzi, otrzymasz Każda część systemu zna swoją funkcję: structured design with clearly defined roles. - the brain that decides who does what and in what order. Orchestrator - narrow experts, each handling a specific task: classification, response generation, data retrieval. Specialists - makes sure the system isn’t living like a goldfish, giving it access to past context and knowledge. Memory - catches errors and ensures resilience, so one failure doesn’t bring everything down. Guard - monitors execution, collects logs, and provides visibility. Observer - polishes the final output and delivers it to the next stage. Egress Signs. Na tym poziomie widzisz formalne kontrakty (często JSON) łączące role. Możesz testować komponenty indywidualnie, wymieniać lub rozszerzać je bez łamania całego systemu. Risks. Musisz myśleć architektonicznie, projektować role i opierać się potrzebie po prostu „rzucać w inną prośbę”. When it makes sense. Środowiska produkcyjne, procesy biznesowe i produkty w świecie rzeczywistym. Wszystko poza eksperymentami będzie musiało ewoluować na tym etapie. I to właśnie tam, gdzie AAC formalizuje role, dodaje dyscypliny i umożliwia ten kluczowy skok od „prędkiego hakowania” do prawdziwego inżynierii. AAC (Agent Action Chains) How to Use This Model Jak korzystać z tego modelu Prawdziwa wartość modelu dojrzałości polega na tym, że działa on jak lustro. pozwala na szczere spojrzenie na swój projekt, zobaczyć, gdzie się znajdujesz i dowiedzieć się, co musi się zmienić, aby pójść do przodu. For self-assessment. Jeśli budujesz coś samodzielnie lub w małym zespole, model jest zasadniczo szybką listą kontrolną. Ten zwiastun pomoże Ci zidentyfikować jutrzejsze niedogodności i przygotować się do nich z wyprzedzeniem. „Czy wciąż żyjemy na ziemi szybkiej? czy zbudowaliśmy proste łańcuchy? czy już utonęliśmy w spaghetti?” For teams. Menedżer produktu, inżynier i analityk nie muszą zagubić się w szczegółach technicznych - mogą po prostu nazwać poziom. - i wszyscy wiedzą dokładnie, co to znaczy. Mniej tarcia, bardziej produktywne rozmowy. "Jesteśmy na etapie łańcucha, ale musimy przejść poza spaghetti ASAP" For investors and partners. Model działa również jako sygnał dojrzałości zespołu. Startup, który nadal pracuje z surowymi wskazówkami, może dostarczyć błyszczących demonstracji, na pewno - ale jest to ryzykowna stawka. Ewolucja systemów LLM podąża za tym samym łukiem jak każda technologia: najpierw przychodzi magia, potem chaos, a na koniec - inżynieria. zaczynamy od prostych skryptów, utkniemy w skomplikowanych wskazówkach, spróbujemy łańcuchać rzeczy razem, utonęliśmy w spaghetti ... i dopiero potem zdajemy sobie sprawę: nadszedł czas na budowę architektury. Model dojrzałości pomaga nam stawić czoła tej rzeczywistości: zobaczyć, gdzie jesteśmy, i wiedzieć, gdzie musimy pójść dalej. Dla niektórych oznacza to pozbycie się „monster-prompts”. Dla innych oznacza ucieczkę od pułapki chaotycznych łańcuchów. To jest tam, gdzie Wchodzi do obrazu architektura, która formalizuje ten najwyższy poziom dojrzałości. Ale AAC nie jest magią. Jest to wynik chodzenia drogą. AAC (Agent Action Chains) 👉 Oto wzór projektowania systemu AAC, jeśli chcesz zanurzyć się głębiej. 👉 Oto wzór projektowania systemu AAC, jeśli chcesz zanurzyć się głębiej.