325 lexime

Mashtrimi që Kornizat Agjentike na tërhoqën

nga tyingshoelaces.com8m2024/11/15

Shume gjate; Te lexosh

Kornizat agjente të AI janë abstraksione jo të besueshme dhe thelbësisht joreale. Për të ndërtuar flukse komplekse, të lidhura me zinxhir dhe të përsëritshëm duke përdorur LLM-të kërkon njohuri, aftësi dhe punë të palodhur.

featured image - Mashtrimi që Kornizat Agjentike na tërhoqën

Mashtrimi më i madh që Djalli bëri ndonjëherë ishte të bindte botën se ai nuk ekzistonte…

Ju keni dëgjuar thënien e famshme, "Mashtrimi më i madh që Djalli bëri ndonjëherë ishte të bindte botën se ai nuk ekzistonte".

Referencat teologjike janë të rëndësishme këtu, sepse më shumë se çdo përparim teknologjik në kohët e fundit, mania që rrethon AI Gjenerative është më shumë fe se sa shkencë apo inxhinieri.

Qëllimi i këtij blogu nuk është të luftojë trenin hype (unë sugjeroj Gary Marcus ) për një kundërpeshë. Kjo është një analizë kritike e vajit të gjarprit që i shitet konsumatorit që nuk dyshon. Unë kam një tezë të thjeshtë. Kornizat agjente të AI janë abstraksione jo të besueshme dhe thelbësisht joreale. Për të ndërtuar flukse komplekse, të lidhura me zinxhirë dhe të përsëritshëm duke përdorur LLM-të kërkon njohuri, aftësi dhe punë të palodhur.

Është joshëse të kërkosh një shkurtore, një plumb argjendi; por ju ose mund të hipni në trenin hype derisa binarët të bien ose të ndërtoni themelet për një distancë të gjatë.

Çfarë është AI agjenturore?

Dallimi midis grurit dhe bykut

“Agentic AI është një përparim novator në inteligjencën artificiale. Një kombinim i teknikave, modeleve dhe qasjeve të ndryshme të AI, fuqizon një racë të re agjentësh autonome që mund të analizojnë të dhënat, të vendosin qëllime dhe të ndërmarrin veprime për t'i arritur ato – të gjitha me mbikëqyrje minimale njerëzore. AI agjenturore i lejon këta agjentë autonome të arrijnë njohjen pothuajse njerëzore në shumë fusha, duke i kthyer ato në makineri për zgjidhjen e problemeve që lulëzojnë në mjedise dinamike dhe vazhdimisht mësojnë dhe përmirësohen me çdo ndërveprim.

Uau. E mahnitshme. Mendje fryrje.

Po ashtu marrëzi absolute... Më lejoni të provoj,

AI agjenturore është përdorimi i AI gjeneruese në rrjedhat komplekse të punës. Rezultatet që prodhohen nga LLM mund ose nuk mund të jenë të rëndësishme për detyrën e caktuar. AI agjenturore trashëgon sofistikimin, inteligjencën dhe besueshmërinë e prodhimit të saj nga udhëzimet dhe programimi i sistemit, shumica e të cilave është shumë e abstraktuar, e shkruar nga fillestarët dhe do të rezultojë në një sistem që mezi funksionon.

AI agjenturore është e shkëlqyeshme për të bërë demonstrime për konsumatorët jo të sofistikuar, por përgjithësisht e keqe për zbatimin në çdo rast përdorimi ku rezultati është në të vërtetë i rëndësishëm. Nuk do të funksionojë fare nëse nuk jeni ekspert, por pothuajse me siguri nuk jeni.

Më lejoni të jem i qartë, nuk jam aspak skeptik për Gen AI, mendoj se përdoret me ekspertizë dhe me mjete që ende nuk ekzistojnë, ne mund të zbatojmë flukse pune që do të ndryshojnë mënyrën se si ne kryejmë detyrat. Ndoshta jo në masën për të cilën flasin vrasësit e AI, por definitivisht në masën e një ndryshimi paradigme për shumë mënyra të punës.

Nuk është rastësi që rasti i parë i përdorimit të vrasësve për Gen AI është programimi, sepse programimi do të jetë gjithmonë fusha e parë për të marrë veglat dhe infrastrukturën e duhur. Arsyeja për këtë është e thjeshtë. Ne ndërtojmë veglat dhe infrastrukturën për mjetet e programimit me, errrm, programim. Programimi është një shqetësim i nivelit të ulët, një rast i përsosur i përdorimit të parë. Është gjithashtu një aftësi që, meqë ra fjala, do të jetë ende një (nëse jo 'e') aftësia e rëndësishme dhe më e lakmuar për ditë, javë, muaj, vite dhe ndoshta brezat që do të vijnë.

Mjetet e kodimit kanë vërtetuar potencialin e Gen AI. Unë kam dy mjete të veçanta LLM që (paguaj dhe) i përdor çdo ditë për kodim, sepse ato shpesh bllokohen nga kërkesa dërrmuese dhe infrastruktura e gjelbër. Unë i përdor ato njëkohësisht në dritare të ndryshme IDE. Kjo për shkak se ato janë të reja, pra të ngadalta dhe ndonjëherë të kripura.

Edhe kështu, ata kanë revolucionarizuar rrjedhën time të punës. Unë jam duke kaluar një ditë të keqe kur nis kompjuterin tim dhe Claude është i zënë, kështu që unë po flas me o1-mini. Dhe ky është fillimi i ndryshimit të mënyrave që Gen AI do të ndryshojë mënyrën se si punoni…

Këto mjete po ndërtohen nga themeli; janë krejt të reja dhe ende jo të besueshme. Kjo është emocionuese sepse është fillimi. Jemi në mes të një valë të re. Që më sjell në temën e këtij blogu. Gënjeshtra dhe tejkalimi që është AI agjenturore.

Gënjeshtra e AI agjenturore

Një abstraksion i thjeshtë i një API komplekse jo të besueshme.

Shumë vite më parë, unë drejtoja një agjenci zhvillimi dhe kishim një zhvillues të sapodiplomuar që iu bashkua ekipit. Unë u vendosa atyre një detyrë mjaft të thjeshtë (për të ndërtuar një formë ueb në PHP). Do të kontrolloja rregullisht.

“Si po shkon?

“Vërtet mirë!

Kaluan ditët dhe javët, dhe trokitni lehtë mbi tap tap shkoi në tastierë. Po zgjati shumë, kështu që shkova te programuesi dhe i kërkova të më tregonin kodin me të cilin po punonin. Ishte një shtresë e ndërthurur e sytheve forÇdo, që arrinte në mijëra rreshta kodi.

Më mbyti stomaku (klienti po e priste këtë…), dhe më humbën fjalët. Ishte një goditje fizike, gjithçka klikoi. Ishte faji im që nuk ofrova udhëzime? A ishte programuesi një kauzë e humbur? Çfarë dreqin do t'i them klientit që duhet të paguajë për këtë? (Ne faturuam kohën, jo rezultatet…)

Arsyeja pse largohem është sepse kjo është saktësisht e njëjta ndjenjë që kam kur lexoj dokumentet për çdo Kornizë Agjentike që kam hasur. Unë nuk jam vetëm.

Nuk dua të zgjedh ndonjë kornizë specifike (ende nuk kam gjetur ndonjë Kornizë Agjentike Python për të cilën nuk mund ta zbatoj këtë), por kur dokumentet tuaja fillojnë të flasin për rolet, punëtorët, shefat dhe historitë, i gjithë koncepti fillon për të lexuar si një roman fantazi.

Arsyeja është se e gjithë kjo është një roman fantazi. Është një mjet revolucionar dhe i sofistikuar i ndërtuar mbi teknologjinë pioniere, që funksionon jashtë kutisë, për fillestarët. Dhe çdo grimë aq e ndërlikuar dhe kontradiktore sa tingëllon.

Nuk po them se flukset komplekse të punës LLM nuk mund të funksionojnë; Po them që ekspertiza e kërkuar dhe niveli i kontrollit të nuancave janë jashtëzakonisht të larta, dhe krijimi i kornizave 'të thjeshta dhe të arritshme' është thjesht i pamundur derisa veglat të bëhen më të pjekura dhe themelet të jenë më të forta.

Ka shumë pak njerëz në botë për momentin (edhe pse ata ecin mes nesh!) me ekspertizën për të krijuar dhe mbajtur flukse pune të besueshme, komplekse përsëritëse (bazuar në Gen AI ose jo!) që funksionojnë dhe janë të vërtetë me përkufizimin e Agjentit flukset e punës që janë duke u shitur shumica.

Por këtu është gjëja që më shqetëson; këta pak pionierë janë duke punuar në rastet e përdorimit të fundit për të cilat ne ndoshta nuk jemi në dijeni. Ata nuk po ndërtojnë publikisht në Twitter, as nuk po shkruajnë blogje dhe udhërrëfyes. Ata nuk janë të përqendruar në krijimin e një kornize, kështu që ju mund të automatizoni lehtësisht postimet tuaja në LinkedIn. Ata po vazhdojnë me gjërat në heshtje dhe pas dyerve të mbyllura.

E kuptoj, e kuptoj vërtet.

Njerëzit duan një kornizë të aksesueshme, të lehtë për t'u përdorur, që do t'i lejojë ata të ndërtojnë flukse pune të besueshme dhe komplekse me rezultate reale të biznesit. Unë dua shumë gjëra. Eliksiri i jetës. Rriteni disa centimetra më shumë. Bëhu kampion tenisi në klubin tim sportiv. Ka më shumë gjasa që unë të bëhem kampioni i gjatë i tenisit vendas me rini të përjetshme sesa që ndonjë nga këto korniza agjente të funksionojë për përdoruesin mesatar dhe më besoni mua dhe këdo që më ka parë të luaj tenis kur them se kjo është jashtëzakonisht e pamundur.

Kornizat agjente janë përpjekja për të ndërtuar një ndërtues uebsajti WYSIWYG përpara se të kemi rënë dakord për një standard të vetëm të unifikuar për HTML. Janë të parakohshme.

Ky nuk është rasti i qerres para kalit; kjo po përpiqet të ndërtojë një raketë përpara se të zbulojmë energjinë elektrike. Një grabitje oportuniste e tokës që tashmë ka pasur sukses.

Shtresat e Abstraksioneve

Një mjet i thyer.

Problemi me sigurimin e një mjeti ose kuadri që ju lejon të abstraktoni funksionalitetin është se ai vjen me një sërë supozimesh. Kur blej një çekiç, supozoj se do të funksionojë. Kur blej një pastrues presioni, supozoj se do të funksionojë.

Problemi është se kur përdor një kornizë, supozoj se do të funksionojë. Por kjo është fjalë për fjalë e pamundur duke pasur parasysh pjekurinë e teknologjisë themelore. Larg rritjes së adoptimit, Agentic Frameworks po shet një iluzion në krye të demonstrimeve shumë të kontrolluara dhe rasteve të përdorimit të kufizuar që nuk do të funksionojnë kurrë në duart e përdoruesve tipikë (dhe ka miliona ...).

Dëmi që po shkaktojnë është i madh. Ashtu si zhvilluesit këto ditë mësojnë React përpara se të mësojnë javascript, ose miratojnë korniza përpara se të mësojnë rreth parimeve të programimit. Një brez teknologësh entuziastë po kërcejnë në trenin hype për të mësuar kornizën 'x'. Këtu është gjëja; nuk do të funksionojë (në asnjë standard të arsyeshëm), në fakt, ndërtimi i një demo ose prototipi është një arritje në vetvete.

Por kjo nuk do të thotë se Gen AI ose LLM "nuk" funksionojnë, edhe pse kjo do të bëhet supozimi në një afat të shkurtër. Thjesht do të thotë se ne nuk kemi arritur një nivel pjekurie të teknologjisë bazë për të qenë në gjendje të ndërtojmë në mënyrë të sigurtë abstraksione të forta në krye të saj. Ka shumë probleme për t'u zgjidhur së pari. Disa çështje themelore që duhet të zgjidhen në një nivel të thellë nga ofruesit e LLM përfshijnë, por nuk kufizohen në:

Vonesa

Disponueshmëria

Siguria

Prodhim i besueshëm

Shkalla

Pra, po, ajo që po them është se API-të themelore shpesh janë të mbingarkuar nga përdorimi; ato janë të ngadalta, të pambrojtura ndaj hakerimit (veçanërisht hakerimi i shpejtë) dhe prezantojnë ndryshime të jashtëzakonshme në baza javore. Novatorët e vërtetë po punojnë shumë pas dyerve të mbyllura për këto probleme. Por derisa të kemi më shumë përparim, fat të mirë në ndërtimin e një sistemi të besueshëm prodhimi, aq më pak një kornizë.

Nëse nuk keni një kuptim të API-ve themelore (që meqë ra fjala, është zbulimi aktual i vlefshëm me të cilin po punojmë të gjithë), si mund të ndërtoni një sistem në krye të tij? Disa API nuk kërkojnë që ne të kuptojmë kufizimet e tyre kryesisht sepse ato janë një kuti e zezë që thjesht funksionon. Do të duhen vite, nëse jo një brez që LLM-të të arrijnë këtë nivel pjekurie, deri atëherë duhet të vijë me një shenjë paralajmëruese "Përdorimi i prodhimit vetëm për ekspertët".

Është e pamundur të ndërtohet një abstraksion i besueshëm në majë të rërës që lëviz. Në fakt, kjo thyen parimin bazë të programimit kompjuterik. Abstraksioni në shkencat kompjuterike është procesi i heqjes së elementeve që shpërqendrojnë nga elementët më të rëndësishëm. Ne nuk mund të përqendrohemi në detaje të nivelit të lartë kur sistemi i nivelit të ulët nuk është i besueshëm; ne duhet të kuptojmë nuancën dhe përdorimin brenda një paradigme të sofistikuar. Jo një kornizë magjike e ulët/pa kod (me abstraksione fantastike).

Kjo po na çon në luginën e zhgënjimit, i cili ndonëse në vetvete nuk është problem pasi ofron hapësirë për të ndërtuar gjëra me vlerë të vërtetë, është ende zhgënjyese për t'u vëzhguar.

Truku më i madh

Shpikja e timonit në epokën Jurassic.

Truku më i madh që kanë nxjerrë ndonjëherë kornizat Agjentike të AI është t'ju bindin se ato janë të nevojshme. Ata janë djalli i peizazhit LLM.

Ju nuk keni nevojë për ekipe, agjentë, histori të pasme dhe ndërfaqe të bukura grafike që ju tregojnë gjëra që nuk do të funksionojnë kurrë.

Ju duhet të kuptoni se LLM-të janë mjete të fuqishme që duhet t'i kuptoni pa histori nga një roman fantazi. Aplikacionet tuaja Hello World dhe demo duhet të ndërtohen me dorë, në kod. Kur të kuptoni se si, pse, dhe çfarë dhe mund të kontrolloni hyrjet dhe daljet e modeleve të Gen AI, atëherë do të keni një themel për të dalë në botë dhe për të ndërtuar diçka të dobishme. Dhe ndoshta do të marrë pak kohë.

Jo me magjistarët dhe menaxherët, agjentët dhe dragonjtë, por me përdorimet e sakta deterministe të një përparimi në AI.

Botuar fillimisht: https://tyingshoelaces.com/blog/agentic-framework-lie