Olen rakentanut yli 12 tuotanto-AI-agenttijärjestelmää kehitys-, DevOps- ja datatoiminnoissa.Tässä on miksi nykyinen hype autonomisten agenttien ympärillä on matemaattisesti mahdotonta ja mikä todella toimii tuotannossa. Kaikki sanovat, että 2025 on AI-agenttien vuosi. Otsikot ovat kaikkialla: "Autonominen AI muuttaa työtä", "Agentit ovat seuraava raja", "Tulevaisuus on agentti." Samaan aikaan olen viettänyt viimeisen vuoden rakentamalla monia erilaisia agenttijärjestelmiä, jotka todella toimivat tuotannossa. Viimeisen vuoden aikana olen rakentanut yli tusinan tuotantovälineiden järjestelmiä koko ohjelmistokehityksen elinkaaren aikana: Käyttöliittymän generaattorit, jotka luovat toiminnallisia React-komponentteja luonnollisesta kielestä, koodin uudelleenmuokkausagentit, jotka nykyaikaistavat vanhoja koodipohjaisia tietokantoja, dokumentointigeneraattorit, jotka ylläpitävät API-dokumenteja automaattisesti, ja toiminnalliset generaattorit, jotka muuttavat eritelmät työskentelyyn. Development agents : Tietokannan toiminnan agentit, jotka käsittelevät monimutkaisia kyselyitä ja siirtymiä, DevOps-automaatio AI-järjestelmät, jotka hallitsevat infrastruktuuria koodina useiden pilvipalveluntarjoajien välillä. Data & Infrastructure agents AI-pohjaiset CI/CD-putket, jotka korjaavat nauhaongelmia, tuottavat kattavia testaussarjoja, suorittavat automaattisia kooditarkastuksia ja luovat yksityiskohtaisia vetopyyntöjä oikeilla kuvauksilla. Quality & Process agents Nämä järjestelmät toimivat. He toimittavat todellista arvoa. He säästävät tunteja manuaalista työtä joka päivä. Ja juuri siksi luulen, että suuri osa siitä, mitä kuulet vuodesta 2025 olevan "agenttien vuosi", jättää huomiotta keskeiset todellisuudet. TL;DR: Three Hard Truths About AI Agents TL;DR: Kolme kovaa totuutta AI-agentteista Kun olen rakentanut 12 tuotantojärjestelmää, tässä on mitä olen oppinut: 1. Virhetasot koostuvat eksponentiaalisesti monivaiheisissa työnkulkuissa. 95% luotettavuus per askel = 36% menestys yli 20 askelta. 
 
 
 Context-ikkunat luovat neliökustannuksia.Pitkät keskustelut tulevat kieltävästi kalliiksi mittakaavassa. Todellinen haaste ei ole tekoälyn kyvyt, vaan työkalujen ja palautejärjestelmien suunnittelu, joita toimijat voivat todella käyttää tehokkaasti. Matemaattinen todellisuus, josta kukaan ei puhu Tässä on epämiellyttävä totuus, että jokainen AI-agenttiyritys tanssii ympärilleen: virheiden kompensointi tekee itsenäisistä monivaiheisista työnkulkuista matemaattisesti mahdottomia tuotannon mittakaavassa. Jos jokaisella agentin työnkulun vaiheella on 95 prosentin luotettavuus, mikä on optimistista nykyisille LLM-ohjelmille, niin: 
 
 
 
 5 askelta = 77 % menestysaste 10 askelta = 59 % menestysaste 20 askelta = 36 % menestysaste Tuotantojärjestelmät tarvitsevat 99,9%+ luotettavuutta. Vaikka saavutat maagisesti 99% per-step luotettavuutta (jota kenelläkään ei ole), saat silti vain 82% menestystä yli 20 vaihetta. Tämä ei ole välitön tekninen ongelma. Tämä ei ole mallin kykyongelma. Tämä on matemaattinen todellisuus. Minun DevOps-agentti toimii juuri siksi, että se ei ole itse asiassa 20-vaiheinen itsenäinen työnkulku. Se on 3-5 erillistä, itsenäisesti todennettavissa olevaa toimintaa, jossa on nimenomaiset käänteispisteet ja ihmisen vahvistusportit. "agentti" käsittelee infrastruktuurin koodin tuottamisen monimutkaisuutta, mutta järjestelmä on rakennettu luotettavuuden matemaattisten rajoitusten ympärille. Jokainen onnistunut agenttijärjestelmä, jonka olen rakentanut, seuraa samaa kuviota: rajatut yhteydet, todennettavissa olevat toimet ja ihmisen päätöksentekopisteet (joskus) kriittisissä yhteyksissä. Token-talous, joka ei lisää On toinen matemaattinen todellisuus, jota agentti-evangelistit helposti jättävät huomiotta: kontekstiikkunat luovat neliökustannusten skaalauksen, joka tekee keskusteluyksiköistä taloudellisesti mahdottomia. Tässä on, mitä todella tapahtuu, kun rakennat "keskustelu" agentti: 
 
 
 
 
 Jokainen uusi vuorovaikutus edellyttää kaikkien aiempien yhteyksien käsittelyä Token-kustannukset mittakaavassa neljänneksellä keskustelun pituudella 100 kierroksen keskustelu maksaa 50-100 dollaria pelkästään tokeneissa Moninkertaistetaan tuhansilla käyttäjillä ja katsot kestämätöntä taloutta Ensimmäiset vuorovaikutukset olivat halpoja.Kun istunnon 50. kysely, jokainen vastaus maksoi useita dollareita - enemmän kuin se antoi arvoa.Talous ei yksinkertaisesti toimi useimmilla skenaarioilla. Minun toiminnon tuottaminen agentti onnistuu, koska se on täysin valtiottoman: kuvaus → toiminto → tehty. Ei kontekstia ylläpitää, ei keskustelua seurata, ei neliökustannusten räjähdys. Se ei ole "chat code" kokemus, se on keskittynyt työkalu, joka ratkaisee tietyn ongelman tehokkaasti. Menestyneimmät "agentit" tuotannossa eivät ole puhekohtaisia ollenkaan.He ovat älykkäitä, rajallisia työkaluja, jotka tekevät yhden asian hyvin ja pääsevät pois tieltä. Työkalu Engineering Reality Wall Vaikka ratkaisitkin matemaattiset ongelmat, löysit toisenlaisen seinän: agenttien tuotantolaatuisten työkalujen rakentaminen on täysin erilainen tekniikan kurinalaisuus, jota useimmat joukkueet aliarvioivat. Työkalukutsut ovat itse asiassa melko tarkkoja nyt. Todellinen haaste on työkalujen suunnittelu. Jokainen työkalu on suunniteltava huolellisesti antamaan oikea palaute ilman, että kontekstiikkuna ylitetään. Sinun on ajateltava: 
 
 
 
 
 Miten agentti tietää, onko operaatio osittain onnistunut? Miten kommunikoit monimutkaisia tilan muutoksia polttamatta tokeneja? Tietokannan kysely voi palauttaa 10 000 riviä, mutta agentti tarvitsee vain tietää "kysely onnistui, 10k tuloksia, tässä ovat ensimmäiset 5." Kun työkalu epäonnistuu, mitä tietoja agentti tarvitsee palauttaa?Liian vähän ja se on jumissa; liikaa ja tuhlaat kontekstia. Miten käsittelet toisiaan vaikuttavia toimintoja? Tietokannan tapahtumat, tiedostojen lukot, resurssiriippuvuudet. Tietokannan agentti ei toimi siksi, että työkalukutsut eivät ole luotettavia, vaan siksi, että vietin viikkoja suunnittelemaan työkaluja, jotka kommunikoivat tehokkaasti AI: n kanssa. Jokainen työkalu palauttaa jäsennellyn palautteen, jota agentti voi todella käyttää päätösten tekemiseen, ei vain raaka-API-vasteita. Yritykset, jotka lupaavat "yhdistä API:t ja agenttimme selvittää sen", eivät ole tehneet tätä teknistä työtä. He käsittelevät työkaluja, kuten ihmisen rajapintoja, eivät AI-rajapintoja. Tuloksena ovat agentit, jotka teknisesti tekevät onnistuneita API-puheluita, mutta eivät voi todella suorittaa monimutkaisia työnkulkuja, koska he eivät ymmärrä, mitä tapahtui. Jokaisen tuotantovälineiden järjestelmän likainen salaisuus on se, että tekoäly tekee ehkä 30 prosenttia työstä.Muut 70 prosenttia on työkalutekniikkaa: palautteen käyttöliittymien suunnittelu, asiayhteyden tehokas hallinta, osittaisten vikojen käsittely ja palautusmekanismien rakentaminen, joita tekoäly voi todella ymmärtää ja käyttää. Integraation todellisuustarkastus Mutta sanokaamme, että ratkaiset luotettavuusongelmat ja talouden. Sinun on vielä integroitava todelliseen maailmaan, ja todellinen maailma on sotku. Yritysjärjestelmät eivät puhdista API: ta, jotka odottavat AI-agenttien organisoivan niitä.Ne ovat vanhoja järjestelmiä, joilla on outoja piirteitä, osittaisia epäonnistumistapoja, todentamisvirtoja, jotka muuttuvat ilman ilmoitusta, hintarajoituksia, jotka vaihtelevat päivän aikana, ja vaatimustenmukaisuusvaatimuksia, jotka eivät sovi kunnolla prompt-malleihin. Minun tietokantani agentti ei vain "autonomisesti suorita kyselyjä." Se navigoi yhteyden yhdistämiseen, käsittelee transaktioiden palautuksia, kunnioittaa vain luettuja replikoita, hallitsee kyselyn aikavälejä ja kirjaa kaiken auditointiteitä varten. AI käsittelee kyselyn luomista; kaikki muu on perinteistä järjestelmien ohjelmointia. Yritykset, jotka lupaavat "autonomisia toimijoita, jotka integroituvat koko teknologian joukkoon", ovat joko liian optimistisia tai eivät ole todella yrittäneet rakentaa tuotantojärjestelmiä mittakaavassa. Mikä oikeasti toimii (ja miksi) Kun olen rakentanut yli tusinan eri agenttijärjestelmiä koko ohjelmistokehityksen elinkaaren ajan, olen oppinut, että menestyneet järjestelmät jakavat mallin: 
 
 
 
 
 
 My UI Generation Agent toimii, koska ihmiset tarkistavat jokaisen luodun rajapinnan ennen käyttöönottoa. AI käsittelee luonnollisen kielen kääntämisen monimutkaisuutta toiminnallisiin React-komponentteihin, mutta ihmiset tekevät lopulliset päätökset käyttäjäkokemuksesta. Tietokannan agentti toimii, koska se vahvistaa jokaisen tuhoisan toiminnan ennen suorittamista. AI käsittelee liiketoiminnan vaatimusten kääntämisen monimutkaisuutta SQL: hen, mutta ihmiset säilyttävät hallinnan tietojen eheydestä. Toimintojen tuottaminen toimii, koska se toimii selkeästi määriteltyjen rajojen sisällä. Anna sille eritelmä, palauta toiminto. Ei sivuvaikutuksia, ei valtionhallintaa, ei integroinnin monimutkaisuutta. My DevOps-automaatio toimii, koska se tuottaa infrastruktuuria koodina, jota voidaan tarkistaa, versioida ja kääntää takaisin. AI käsittelee vaatimusten kääntämisen monimutkaisuutta Terraformissa, mutta käyttöönottoputki ylläpitää kaikkia turvallisuusmekanismeja, joihin olemme oppineet luottamaan. Minun CI / CD-agentti toimii, koska jokaisella vaiheella on selkeät onnistumiskriteerit ja palautusmekanismit. AI käsittelee koodin laadun analysoinnin ja korjausten tuottamisen monimutkaisuutta, mutta putki säilyttää hallinnan siitä, mitä todella sulautuu. Malli on selkeä: tekoäly käsittelee monimutkaisuutta, ihmiset ylläpitävät hallintaa ja perinteinen ohjelmistojen suunnittelu käsittelee luotettavuutta. My Predictions Ennustukseni Tässä on erityinen ennusteeni siitä, kuka taistelee vuonna 2025: Venture-rahoitettu "täysin itsenäinen agentti" -yritys osuu talouden seinään ensin. Niiden esitykset toimivat erinomaisesti viiden vaiheen työnkulkuilla, mutta asiakkaat vaativat yli 20 vaiheen prosessia, jotka hajoavat matemaattisesti. Yritysohjelmistoyhtiöt, jotka ovat kiinnittäneet "AI-agentteja" olemassa oleviin tuotteisiin, näkevät adoption pysähtyvän. Samaan aikaan voittajia ovat joukkueet, jotka rakentavat rajoitettuja, verkkotunnuskohtaisia työkaluja, jotka käyttävät tekoälyä koville osille säilyttäen samalla ihmisen hallinnan tai tiukat rajat kriittisiin päätöksiin. Markkinat oppivat eron AI: n välillä, joka esittelee hyvin ja AI: n, joka kuljettaa luotettavasti. En vedä AI:ta vastaan.Vedon nykyistä lähestymistapaa agenttiarkkitehtuuria vastaan.Mutta uskon, että tulevaisuus on paljon arvokkaampi kuin hype ehdottaa. Oikean tien rakentaminen Jos ajattelet rakentamista AI-agenttien kanssa, aloita näillä periaatteilla: Mitä agenttisi voi tehdä ja mitä se antaa ihmisille tai deterministisille järjestelmille? Define clear boundaries. Miten käsittelet 20-40% tapauksista, joissa AI tekee virheitä? Design for failure. Kuinka paljon jokainen vuorovaikutus maksaa, ja miten se skaalautuu käytön kanssa? Solve the economics. Käyttäjät luottavat työkaluihin, jotka toimivat johdonmukaisesti enemmän kuin he arvostavat järjestelmiä, jotka joskus tekevät taikaa. Prioritize reliability over autonomy. Käytä tekoälyä koville osille (ymmärrys tarkoituksesta, sisällön tuottaminen), mutta luota perinteiseen ohjelmistojen suunnitteluun kriittisille osille (toiminta, virheen käsittely, valtionhallinta). Build on solid foundations. Se ei vain näytä siltä, mitä kaikki lupaavat vuonna 2025. Ja juuri siksi se onnistuu. Todelliset oppitunnit trendeistä Ero "työt demo" ja "työt mittakaavassa" on valtava, ja suurin osa teollisuudesta on edelleen selvittää tämä. Haasteet agenttien luotettavuuden, kustannusten optimoinnin ja integroinnin monimutkaisuuden ympärillä ovat kiehtovia teknisiä ongelmia, joilla ei ole vielä ilmeisiä ratkaisuja. Suosittelen säännöllisesti tiimiä ja yrityksiä navigoimaan näihin tarkkoihin haasteisiin - arkkitehtuuripäätöksistä välttämään ansoja, joita olen oppinut ensikäden. Mitä enemmän ihmiset rakentavat todellisia järjestelmiä ja jakavat rehellisiä kokemuksia, sitä nopeammin me kaikki selvitämme, mikä todella toimii. Jos haluat syventyä johonkin näistä aiheista. X

Read My Stories

Tämä ääni on tuotettu tarinan alkuperäisellä kielellä!

Lakkaa uskomasta agentti hype - numerot eivät valehtele

About Author

KOMMENTIT

RIPUTA TAGSIA

TÄMÄ ARTIKKELI ESITETTIIN

Related Stories

About Bitcoin And “Web 2.5,” HackerNoon’s First Documentary

PENANCE

Meet dRPC: HackerNoon Company of the Week

Noonies Interview with Stefano Pavone, the Retrogaming Reporter

About Bitcoin And “Web 2.5,” HackerNoon’s First Documentary

PENANCE

Meet dRPC: HackerNoon Company of the Week

Noonies Interview with Stefano Pavone, the Retrogaming Reporter

Light-Mode

Classic

Newspaper

Minty

Dark-Mode

Neon Noir

Minty

HN StartUps