Ați auzit celebrul citat: „Cel mai mare truc pe care Diavolul l-a făcut vreodată a fost să convingă lumea că nu există”.
Referințele teologice sunt relevante aici, deoarece mai mult decât orice progres tehnologic din ultimele timpuri, mania care înconjoară IA generativă este mai mult religie decât știință sau inginerie.
Scopul acestui blog nu este acela de a lupta cu trenul hype (sugerez lui Gary Marcus ) pentru o contragreutate. Aceasta este o analiză critică a uleiului de șarpe vândut unui consumator nebănuitor. Am o teză simplă. Cadrele AI agentice sunt abstracții nesigure și fundamental nerealiste. Pentru a construi fluxuri complexe, înlănțuite și repetabile folosind LLM-uri necesită cunoștințe, abilități și muncă asiduă.
Este tentant să cauți o scurtătură, un glonț de argint; dar poți fie să călătorești cu trenul de hype până când șinele se desprind, fie să construiești bazele pe termen lung.
Diferențierea dintre grâu și pleava
„Agentic AI este un progres revoluționar în inteligența artificială. O combinație de diferite tehnici, modele și abordări AI, dă putere unei noi generații de agenți autonomi care pot analiza datele, pot stabili obiective și pot lua măsuri pentru a le atinge, toate cu o supraveghere umană minimă. Agentic AI le permite acestor agenți autonomi să obțină o cunoaștere aproape umană în multe domenii, transformându-i în mașini de rezolvare a problemelor care prosperă în medii dinamice și învață și se îmbunătățesc constant cu fiecare interacțiune.
Wow. Uimitor. surprinzător.
De asemenea, absolut prostii... Lasă-mă să încerc,
AI agentic este utilizarea AI generativă în fluxuri de lucru complexe. Rezultatele care sunt produse de LLM pot fi sau nu relevante pentru sarcina atribuită. Agentic AI moștenește sofisticarea, inteligența și fiabilitatea rezultatelor sale din instrucțiunile și programarea sistemului, majoritatea fiind foarte abstracte, scrise de începători și vor avea ca rezultat un sistem care abia funcționează.
Agentic AI este excelent pentru realizarea demo-urilor pentru consumatorii nesofisticați, dar în general rău pentru implementare în orice caz de utilizare în care rezultatul este de fapt important. Nu va funcționa deloc decât dacă ești un expert, dar aproape sigur că nu ești.
Permiteți-mi să fiu clar, nu sunt deloc sceptic cu privire la Gen AI, cred că este folosit cu experiență și, cu unelte care încă nu există, putem implementa fluxuri de lucru care vor schimba modul în care ne îndeplinim sarcinile. Poate că nu în măsura despre care vorbesc cei care au condamnat AI, dar cu siguranță în măsura unei schimbări de paradigmă pentru multe moduri de lucru.
Nu este o coincidență că primul caz de utilizare ucigaș pentru Gen AI este programarea, deoarece programarea va fi întotdeauna primul domeniu care va obține instrumente și infrastructură adecvate. Motivul pentru aceasta este simplu. Construim instrumentele și infrastructura pentru instrumente de programare cu, errrm, programare. Programarea este o preocupare de nivel scăzut, un prim caz de utilizare perfect. Este, de asemenea, o abilitate care, apropo, va fi încă o abilitate relevantă și cea mai râvnită (dacă nu „cea”) pentru zile, săptămâni, luni, ani și, probabil, generațiile viitoare.
Instrumentele de codificare au dovedit potențialul Gen AI. Am două instrumente LLM separate pe care (plătesc și) le folosesc zilnic pentru codare, deoarece adesea sunt blocate de cererea copleșitoare și de infrastructura ecologică. Le folosesc concomitent în diferite ferestre IDE. Acest lucru se datorează faptului că sunt noi, deci lente și uneori fulgioase.
Chiar și așa, mi-au revoluționat fluxul de lucru. Am o zi proastă când îmi pornesc computerul și Claude este ocupat, așa că vorbesc cu o1-mini. Și acesta este începutul modalităților schimbătoare prin care Gen AI va schimba modul în care lucrați...
Aceste instrumente sunt construite de la zero; sunt noi și nu sunt încă de încredere. Este incitant pentru că este începutul. Suntem în mijlocul unui nou val. Ceea ce mă aduce la subiectul acestui blog. Minciuna și supraîntinderea care este Agentic AI.
O simplă abstractizare a unui API complex, nesigur.
Cu mulți ani în urmă, conduceam o agenție de dezvoltare și am avut un dezvoltator proaspăt absolvent alăturat echipei. Le-am stabilit o sarcină relativ simplă (pentru a construi un formular web în PHP). M-aș verifica în mod regulat.
"Cum vă merge?
„Foarte bine!
Au trecut zile și săptămâni, și atingeți apăsați apăsați tastatura. A durat prea mult, așa că m-am dus la programator și i-am rugat să-mi arate codul la care lucrau. Era un strat imbricat de bucle forEach, ajungând în mii de linii de cod.
Stomacul mi s-a scufundat (clientul aștepta asta...) și am rămas fără cuvinte. A fost o lovitură fizică, totul a declanșat. A fost vina mea că nu am oferit îndrumări? A fost programatorul o cauză pierdută? Ce naiba o să-i spun clientului care ar trebui să plătească pentru asta? (Am facturat timpul, nu rezultatele...)
Motivul pentru care mă opresc este că acesta este exact același sentiment pe care îl am atunci când citesc documentele pentru orice cadru agentic pe care l-am întâlnit. nu sunt singur.
Nu vreau să aleg niciun cadru specific (încă nu am găsit niciun cadru Python Agentic la care să nu pot aplica acest lucru), dar când documentele dvs. încep să vorbească despre roluri și lucrători și șefi și poveștile din spate, începe întregul concept a citi ca un roman fantastic.
Motivul este că totul ESTE un roman fantastic. Este un instrument revoluționar și sofisticat, construit pe o tehnologie de pionierat, care funcționează imediat, pentru începători. Și pe cât de complicat și de contrazis sună.
Nu spun că fluxurile de lucru complexe LLM nu pot funcționa; Spun că expertiza necesară și nivelul de control al nuanțelor sunt extrem de ridicate, iar crearea de cadre „simple și accesibile” este pur și simplu imposibilă până când sculele sunt mai mature și fundațiile sunt mai solide.
Există foarte puțini oameni în lume în acest moment (deși se plimbă printre noi!) cu experiența de a crea și menține fluxuri de lucru iterative fiabile și complexe (bazate pe Gen AI sau nu!), care funcționează și sunt fidele definiției Agentic. fluxuri de lucru care sunt vândute în majoritate.
Dar iată lucrul care mă deranjează; acești câțiva pionieri lucrează la cazuri de utilizare de ultimă oră de care probabil nu le cunoaștem. Nu se construiesc în public pe Twitter, nici nu scriu bloguri și ghiduri de utilizare. Nu se concentrează pe crearea unui cadru, astfel încât să vă puteți automatiza cu ușurință postările pe LinkedIn. Ei se descurcă cu lucrurile în liniște și în spatele ușilor închise.
Înțeleg, chiar înțeleg.
Oamenii doresc un cadru accesibil, ușor de utilizat, care să le permită să construiască fluxuri de lucru fiabile și complexe, cu rezultate reale de afaceri. vreau multe lucruri. Elixirul vieții. Crește cu câțiva centimetri mai înalt. Devin campionul de tenis în clubul meu sportiv. Este mai probabil să devin campionul local de tenis înalt, cu tinerețe veșnică, decât ca oricare dintre aceste cadre agentice să funcționeze pentru utilizatorul obișnuit și credeți-mă pe mine și pe oricine m-a văzut jucând tenis când spun că acest lucru este extrem de puțin probabil.
Cadrele agentice sunt încercarea de a construi un constructor de site-uri web WYSIWYG înainte ca noi să ajungem chiar de acord asupra unui singur standard unificat pentru HTML. Sunt prematuri.
Acesta nu este cazul căruței înaintea calului; asta încearcă să construim o rachetă înainte să descoperim electricitatea. O acaparare oportunista de teren care a reusit deja.
O unealtă spartă.
Problema cu furnizarea unui instrument sau a unui cadru care vă permite să abstractizați funcționalitatea este că acesta vine cu un set de ipoteze. Când cumpăr un ciocan, presupun că va funcționa. Când îmi cumpăr o mașină de curățat cu presiune, presupun că va funcționa.
Problema este că atunci când folosesc un cadru, presupun că va funcționa. Dar acest lucru este literalmente imposibil, având în vedere maturitatea tehnologiei de bază. Departe de a crește adoptarea, Agentic Framework-urile vând o iluzie pe lângă demonstrații extrem de controlate și cazuri de utilizare limitate care nu vor funcționa niciodată în mâinile utilizatorului obișnuit (și sunt milioane...).
Daunele pe care le provoacă sunt semnificative. La fel cum dezvoltatorii din zilele noastre învață React înainte de a învăța javascript sau adoptă cadre înainte de a învăța despre principiile de programare. O generație de tehnologi entuziaști sare în trenul hype pentru a învăța cadrul „x”. Iată chestia; nu va funcționa (la niciun standard rezonabil), de fapt, construirea unui demo sau a unui prototip este o realizare în sine.
Dar asta nu înseamnă că Gen AI sau LLM-urile „nu funcționează”, chiar dacă asta va deveni o presupunere pe termen scurt. Înseamnă pur și simplu că nu am atins un nivel de maturitate al tehnologiei de bază pentru a putea construi în siguranță abstracții solide pe deasupra. Sunt prea multe probleme de rezolvat mai întâi. Câteva probleme fundamentale care trebuie rezolvate la un nivel profund de către furnizorii de LLM includ, dar nu se limitează la:
Latența
Disponibilitate
Siguranţă
Ieșire de încredere
Scară
Deci da, ceea ce spun este că API-urile de bază sunt adesea copleșite de utilizare; sunt lenți, vulnerabili la hacking (în special hacking prompt) și introduc modificări de ruptură săptămânal. Adevărații inovatori lucrează din greu în spatele ușilor închise la aceste probleme. Dar până vom avea mai multe progrese, noroc în construirea unui sistem de producție fiabil, cu atât mai puțin a unui cadru.
Dacă nu înțelegeți API-urile de bază (care, apropo, este adevărata descoperire valoroasă cu care lucrăm cu toții), cum puteți construi un sistem pe deasupra? Unele API-uri nu ne cer să înțelegem limitările lor, în principal pentru că sunt o cutie neagră care pur și simplu funcționează. Va dura ani, dacă nu o generație pentru ca LLM-urile să atingă acest nivel de maturitate, până atunci ar trebui să vină cu un semn de avertizare „Utilizare în producție numai pentru experți”.
Este imposibil să construiești o abstractizare de încredere pe deasupra nisipurilor mișcătoare. De fapt, acest lucru rupe principiul de bază al programării computerelor. Abstracția în informatică este procesul de eliminare a elementelor care distrage atenția de la elemente mai importante. Nu ne putem concentra asupra detaliilor de nivel înalt atunci când sistemul de nivel scăzut nu este de încredere; trebuie să înțelegem nuanța și utilizarea în cadrul unei paradigme sofisticate. Nu este un cadru magic low/no-code (cu abstracțiuni fantastice).
Acest lucru ne conduce în dezamăgirea, care, deși nu este o problemă în sine, deoarece oferă spațiu pentru a construi lucruri de adevărată valoare, este totuși dezamăgitor de observat.
Inventarea roții în epoca jurasică.
Cel mai mare truc pe care cadrele Agentic AI l-au făcut vreodată este să vă convingeți că sunt necesare. Ei sunt diavolul peisajului LLM.
Nu aveți nevoie de echipe, agenți, povești de fundal și interfețe destul de grafice care să vă arate lucruri care nu vor funcționa niciodată.
Trebuie să înțelegeți că LLM-urile sunt instrumente puternice pe care ar trebui să le înțelegeți fără povești dintr-un roman fantastic. Hello World și aplicațiile demo ar trebui să fie construite manual, în cod. Când înțelegeți cum, de ce și ce și puteți controla intrările și ieșirile modelelor Gen AI, atunci veți avea o bază pentru a ieși în lume și a construi ceva util. Și probabil că va dura ceva timp.
Nu cu vrăjitori și manageri și agenți și dragoni, ci cu utilizările deterministe precise ale unei descoperiri în AI.
Publicat inițial: https://tyingshoelaces.com/blog/agentic-framework-lie