Hallottad a híres idézetet: "Az ördög legnagyobb trükkje az volt, hogy meggyőzte a világot, hogy nem létezik."
A teológiai hivatkozások azért fontosak itt, mert az utóbbi idők bármely technológiai fejlődésénél a Generatív mesterséges intelligencia körüli mánia inkább vallás, mint tudomány vagy mérnöki tudomány.
Ennek a blognak nem az a célja, hogy a hype-vonattal (javaslom Gary Marcust ) ellensúlyért harcoljon. Ez a gyanútlan fogyasztónak eladott kígyóolaj kritikus elemzése. Van egy egyszerű dolgozatom. Az ügynöki mesterséges intelligencia keretrendszerei megbízhatatlanok és alapvetően irreális absztrakciók. Az összetett, láncolt és megismételhető folyamatok LLM-ek segítségével történő felépítése tudást, készségeket és kemény munkát igényel.
Csábító egy parancsikont, egy ezüstgolyót keresni; de ülhetsz a hype vonaton, amíg a sínek le nem esnek, vagy megépítheted a hosszú távú alapokat.
A búza és a pelyva megkülönböztetése
„Az Agent AI egy úttörő előrelépés a mesterséges intelligencia területén. A különböző mesterséges intelligencia technikák, modellek és megközelítések kombinációja újfajta autonóm ágenseket tesz lehetővé, amelyek képesek elemezni az adatokat, célokat tűzni ki, és lépéseket tenni azok elérése érdekében – mindezt minimális emberi felügyelet mellett. Az Agent AI lehetővé teszi ezeknek az autonóm ágenseknek, hogy sok területen emberközeli megismerést érjenek el, problémamegoldó gépekké alakítva őket, amelyek dinamikus környezetben boldogulnak, és minden interakció során folyamatosan tanulnak és fejlődnek.
Hűha. Elképesztő. Mindblowing.
Abszolút hülyeség is... Hadd próbáljam meg,
Az Agent AI a generatív AI használata összetett munkafolyamatokban. Az LLM-ek által előállított kimenetek lehetnek relevánsak a kijelölt feladat szempontjából, de nem is. Az Agent MI kimenetének kifinomultságát, intelligenciáját és megbízhatóságát a rendszerutasításokból és programozásokból örökli, amelyek többsége erősen absztrahált, kezdők által írt, és egy alig működő rendszert eredményez.
Az Agent AI kiválóan alkalmas demók készítésére a nem kifinomult fogyasztók számára, de általában nem használható olyan esetekben, amikor az eredmény valóban fontos. Egyáltalán nem fog működni, hacsak nem vagy szakértő, de szinte biztosan nem.
Pontosítom, egy cseppet sem vagyok szkeptikus a Gen AI-vel kapcsolatban, szerintem szakszerűen használják, és a még nem létező eszközökkel olyan munkafolyamatokat valósíthatunk meg, amelyek megváltoztatják a feladatok végrehajtását. Talán nem olyan mértékben, mint amilyenről a mesterséges intelligencia végzetmondói beszélnek, de mindenképpen a sokféle munkamódszer paradigmaváltásának mértékében.
Nem véletlen, hogy a Gen AI első gyilkos esete a programozás, mert mindig a programozás lesz az első tartomány, amely megfelelő eszközöket és infrastruktúrát kap. Ennek egyszerű az oka. A programozási eszközök szerszámait és infrastruktúráját errrm programozással építjük ki. A programozás alacsony szintű probléma, tökéletes első használati eset. Ez egy olyan készség is, amely egyébként még mindig (ha nem „a”) releváns és leginkább áhított képesség marad napokon, heteken, hónapokon, éveken át, és valószínűleg az elkövetkező nemzedékekig.
A kódoló eszközök bizonyították a Gen AI-ban rejlő lehetőségeket. Két különálló LLM-eszközöm van, amelyeket naponta (fizetek és) használok kódolásra, mert gyakran blokkolja őket a hatalmas kereslet és a zöld infrastruktúra. Egyidejűleg használom őket különböző IDE ablakokban. Ez azért van, mert újak, ezért lassúak és néha pelyhesek.
Még így is forradalmasították a munkafolyamatomat. Rossz napom van, amikor elindítom a számítógépemet, és Claude elfoglalt, ezért inkább az o1-minivel beszélek. És ez a kezdete annak, hogy a Gen AI megváltoztatja az Ön munkamódszereit…
Ezeket az eszközöket az alapoktól kezdve építik; teljesen újak és még nem megbízhatóak. Ez azért izgalmas, mert ez a kezdet. Egy új hullám kellős közepén vagyunk. Ez elvezet a blog témájához. Az Agentic AI hazugsága és túlkapása.
Egy összetett megbízhatatlan API egyszerű absztrakciója.
Sok évvel ezelőtt egy fejlesztési ügynökséget vezettem, és egy frissen végzett fejlesztő csatlakozott a csapathoz. Meglehetősen egyszerű feladatot állítottam fel nekik (egy webes űrlap elkészítését PHP-ben). Rendszeresen bejelentkeznék.
"Hogy van?
„Tényleg jól!
Teltek-múltak a napok és a hetek, és koppintva koppintva ment a billentyűzet. Túl sokáig tartott, ezért odamentem a programozóhoz, és megkértem, mutassák meg a kódot, amin dolgoztak. Ez a forEach hurkok beágyazott rétege volt, amely több ezer kódsorba nyúlt bele.
Összeszorult a gyomrom (az ügyfél erre várt…), és elvesztem a szavaktól. Fizikai ütés volt, minden kattant. Az én hibám volt, hogy nem adtam útmutatást? A programozó elveszett ügy volt? Mi a fenét mondjak el az ügyfélnek, kinek kell ezért fizetnie? (Időt számláztunk, nem eredményt...)
Azért elkalandozom, mert pontosan ugyanaz az érzésem támad, amikor elolvasom az Agentic Framework dokumentumait, amelyekkel találkoztam. nem vagyok egyedül.
Nem akarok semmilyen konkrét keretet kiválasztani (még nem találtam olyan Python Agentic Framework-et, amelyre ne tudnám alkalmazni), de amikor a dokik elkezdenek beszélni a szerepekről, a dolgozókról, a főnökökről és a háttértörténetekről, az egész koncepció kezdődik. fantasy regényként olvasni.
Az ok az, hogy az egész egy fantasy regény. Ez egy forradalmi és kifinomult eszköz, amely úttörő technológiára épül, és már a dobozból is működik, kezdőknek. És minden olyan bonyolult és ellentmondásos, mint amilyennek hangzik.
Nem azt mondom, hogy az összetett LLM-munkafolyamatok nem működhetnek; Azt mondom, hogy a szükséges szakértelem és az árnyalatok ellenőrzésének szintje rendkívül magas, és „egyszerű és hozzáférhető” keretek létrehozása egyszerűen lehetetlen, amíg a szerszámok kiforrottabbak és az alapok szilárdabbak.
Nagyon kevés ember van jelenleg a világon (bár ők járnak közöttünk!), akik rendelkeznek olyan szakértelemmel, hogy megbízható, összetett iteratív munkafolyamatokat hozzanak létre és tartsanak fenn (a Gen AI alapján vagy sem!), amelyek működnek és megfelelnek az Agentic definíciójának. munkafolyamatokat, amelyek többségét értékesítik.
De ez a dolog zavar engem; ez a néhány úttörő olyan élvonalbeli használati eseteken dolgozik, amelyekről valószínűleg nem is tudunk. Nem építkeznek nyilvánosan a Twitteren, és nem írnak blogokat és útmutatókat. Nem egy keretrendszer létrehozására összpontosítanak, így könnyedén automatizálhatja LinkedIn-bejegyzéseit. Csendben, zárt ajtók mögött intézik a dolgokat.
Értem, tényleg értem.
Az emberek olyan hozzáférhető, könnyen használható keretrendszert szeretnének, amely lehetővé teszi számukra, hogy megbízható és összetett munkafolyamatokat építsenek fel valódi üzleti eredményekkel. Sok mindent akarok. Életelixír. Nőjjön magasabbra néhány centiméterrel. Legyél a teniszbajnok a sportklubomban. Valószínűbb, hogy örök fiatalsággal én leszek a magas helyi teniszbajnok, mint hogy ezek az ügynöki keretek az átlagfelhasználók számára működjenek, és higgyenek nekem és bárkinek, aki látott már teniszezni, amikor azt mondom, hogy ez rendkívül valószínűtlen.
Az ügynöki keretrendszerek kísérletek egy WYSIWYG webhelykészítő létrehozására, mielőtt még megállapodtunk volna a HTML egyetlen egységes szabványában. Koraiak.
Ez nem a szekér esete a ló előtt; ez egy rakétahajót próbál építeni, mielőtt felfedeztük volna az elektromosságot. Opportunista földfoglalás, amely már sikerült.
Törött szerszám.
Az a probléma, hogy olyan eszközt vagy keretrendszert biztosítunk, amely lehetővé teszi a funkcionalitás elvonatkoztatását, hogy egy sor feltételezést tartalmaz. Ha kalapácsot veszek, azt hiszem, hogy működni fog. Amikor nagynyomású tisztítót veszek, feltételezem, hogy működni fog.
A probléma az, hogy amikor keretrendszert használok, feltételezem, hogy működni fog. Ez azonban szó szerint lehetetlen, tekintettel a mögöttes technológia érettségére. Az Agentic Frameworks távolról sem terjed el, hanem egy illúziót árul a szigorúan ellenőrzött demók és véges használati esetek mellett, amelyek soha nem fognak működni a tipikus felhasználó kezében (és milliók vannak…).
Az általuk okozott kár jelentős. Akárcsak manapság a fejlesztők megtanulják a Reactet, mielőtt megtanulnák a JavaScriptet, vagy elfogadják a keretrendszereket, mielőtt megismernék a programozási elveket. Lelkes technológusok generációja pattan fel a hype vonatra, hogy megtanulja az „x” keretrendszert. Itt van a dolog; nem fog működni (semmilyen ésszerű színvonalon), sőt, egy demó vagy prototípus elkészítése önmagában is nagy teljesítmény.
Ez azonban nem jelenti azt, hogy a Gen AI vagy az LLM-ek "nem működnek", még akkor is, ha rövid távon ez lesz a feltételezés. Ez egyszerűen azt jelenti, hogy még nem értük el a mögöttes technológia érettségi szintjét ahhoz, hogy biztonságosan építhessünk rá szilárd absztrakciókat. Túl sok problémát kell először megoldani. Néhány alapvető probléma, amelyet az LLM-szolgáltatóknak mélyen meg kell oldaniuk, többek között, de nem kizárólag:
Látencia
Elérhetőség
Biztonság
Megbízható kimenet
Skála
Tehát igen, azt mondom, hogy a mögöttes API-kat gyakran túlterheli a használat; lassúak, ki vannak téve a hackelésnek (különösen az azonnali hackelésnek), és hetente törést okozó változtatásokat vezetnek be. Az igazi újítók keményen dolgoznak zárt ajtók mögött ezeken a problémákon. De amíg nem haladunk tovább, sok sikert egy megbízható gyártási rendszer kiépítéséhez, még kevésbé egy keretrendszerhez.
Ha nem ismeri a mögöttes API-kat (mely egyébként a tényleges áttörés, amellyel mindannyian dolgozunk), hogyan építhet rá rendszert? Egyes API-k nem követelik meg, hogy megértsük a korlátaikat, főleg azért, mert egy fekete doboz, amely egyszerűen működik. Évekbe fog telni, ha nem egy generáció, mire az LLM-ek elérik ezt az érettségi szintet, addig a "Csak szakértőknek való gyártási felhasználás" figyelmeztető jelzéssel kell megjelennie.
Lehetetlen megbízható absztrakciót építeni a változó homok tetejére. Valójában ez megtöri a számítógépes programozás alapelvét. Az absztrakció a számítástechnikában az olyan elemek eltávolításának folyamata, amelyek elvonják a figyelmet a fontosabb elemekről. Nem tudunk a magas szintű részletekre koncentrálni, ha az alacsony szintű rendszer nem megbízható; egy kifinomult paradigmán belül kell megértenünk az árnyalatokat és a használatot. Nem egy alacsony/kód nélküli mágikus keretrendszer (fantasztikus absztrakciókkal).
Ez a kiábrándultság mélypontjába kerget bennünket, ami bár önmagában nem probléma, mivel teret ad valódi értékű dolgok felépítésének, mégis kiábrándító megfigyelni.
A kerék feltalálása a jura korszakban.
A legnagyobb trükk, amit az Agentic AI-keretrendszerek valaha is kitaláltak, hogy meggyőzzék Önt a szükségességről. Ők az LLM táj ördögei.
Nincs szükség csapatokra, ügynökökre, háttértörténetekre és szép grafikus felületekre, amelyek olyan dolgokat mutatnak meg, amelyek soha nem fognak működni.
Meg kell értened, hogy az LLM-ek hatékony eszközök, amelyeket meg kell értened egy fantasy regény történetei nélkül. A Hello World és a demóalkalmazásokat kézzel kell elkészíteni, kódban. Ha megérti, hogyan, miért és mit, és tudja irányítani a Gen AI modellek bemeneteit és kimeneteit, akkor lesz alapja, hogy kimenjen a világba, és valami hasznosat építsen. És valószínűleg eltart egy ideig.
Nem varázslókkal és menedzserekkel, ügynökökkel és sárkányokkal, hanem a mesterséges intelligencia áttörésének precíz determinisztikus felhasználásával.
Eredeti közzététel: https://tyingshoelaces.com/blog/agentic-framework-lie