Praėjusią savaitę išsiuntėme Ne daugiau kaip mėnesių inžinerinių sprintų – per vieną savaitę, su 10 membranų agento sesijomis, vykstančiomis lygiagrečiai. 1,000 API integrations Visatos membranos „Membrane Universe“ yra mūsų iš anksto sukurtų integracijos žinių biblioteka – viskas, ko agentui ar kūrėjui reikia norint prisijungti prie išorinių API. Jame yra daug tipų elementų, tačiau šiam projektui mes sutelkėme dėmesį į du: Jungtys, apibrėžiančios, kaip prisijungti prie išorinio API (patvirtinimas per OAuth2, API raktai ir kt., plius duomenų rinkimas ir įvykiai) Veiksmų paketai, kurie yra paruoštų naudoti API veiksmų rinkiniai (pvz., „Sukurti „Slack“ pranešimą“, „GitHub sąrašas“), kuriuos gali skambinti agentai ir darbo eigos. Veiksmų paketams mes nesistengiame būti išsamūs – mes generuojame dažniausiai pasitaikančius veiksmus, apimančius ~80% tipiško naudojimo. Kiekvienos integracijos sukūrimas rankiniu būdu užima kūrėją — ištirti dokumentus, išsiaiškinti auth, įgyvendinti klientą, parašyti testus. Tuo tempu 1000 integracijų užtruktų vienam asmeniui maždaug vienerius metus visą darbo dieną. 30–60 minutes Membrane Agent jau žino, kaip dirbti su mūsų platforma. Mes sukūrėme partijų vamzdyną, kad automatiškai apdorotume tūkstančius programų. We saw the opportunity to industrialize it Pastatė dujotiekį Geležinkelis turi du etapus, kurių kiekvieną lemia atskiras serijos scenarijus. Pirmasis etapas susijęs su autentifikavimu – sunkiausia bet kokios integracijos dalis. 2 fazės sluoksniai apie veiksmus, dėl kurių kiekviena integracija yra naudinga. Abu jie seka tą patį modelį: paimkite tinkamas programas, sukite vienu metu dirbančius AI agentus, patvirtinkite rezultatus, paskelbkite, kas praeina, vėliava, kas ne. 1 etapas - autentifikavimas (sudaryti jungtys) Šis scenarijus tvarko pirmąjį žingsnį: įgyvendinti auth kiekvienai programai. How it works: Surenka visas programas iš mūsų API, filtrai tiems, kurie dar neturi jungties Kiekvienai programai (kuri veikia iki 10 vienu metu), ji: Sukuria jungties įrašą Membrane Sukuria agento sesiją mūsų variklyje Sukuria vietinį membranos agentą, kurį valdo Claude Pasako agentui, kurį jungiklį įgyvendinti – agentas žino, kaip sąveikauti su Membrane iš savo sistemos užklausos ir kaip kurti jungiklius per iš anksto įkeltus įgūdžius, todėl vartotojo pranešimas yra tik programos pavadinimas ir URL Laukia, kol agentas baigsis (vidutiniškai 2,5 minutės) Patvirtina rezultatą prieš mūsų schemas – ši grįžtamojo ryšio grandinė yra svarbi agentams, nes jie gali ištaisyti save, kai patvirtinimas nepavyksta Jei galioja: skelbia jungiklį ir skelbia jį viešai Jei negalioja: pažymi programą rankiniu būdu peržiūrėti What Membrane Agent actually does inside each session: Pirma, darbuotojas naudoja ir Jis perskaito dokumentus, išsiaiškina, ar API naudoja OAuth2, API raktus, pagrindinį auth ar kažką kita, ir konfigūruoja visus atitinkamus auth parametrus - kliento ID / slaptus laukus, diapazonus, žetonų URL, darbus. web search web fetch Tada jis įgyvendina API klientą, kuris tinkamai prideda įgaliojimus prie užklausų, parašo bandymo funkciją, kad patikrintų ryšį, ir iš tikrųjų pateikia HTTP užklausas API, kad patvirtintų, jog jis pasiekiamas ir teisingai reaguoja. Galiausiai, ji naudoja Membrane įrankius parašyti visą konfigūraciją atgal į platformą. Agentūra tai daro visiškai savarankiškai. 2.5 minutes per app Padarykite tą matematiką: Tai yra maždaug 10 jungčių, pastatytų ir patvirtintų kas porą minučių - be vieno žmogaus klavišų paspaudimo. 10 agents, ~2.5 minutes each, running in parallel Kiekvienas agentas tvarko vieną jungiklį (arba vieną veiksmų paketą) per sesiją.Mes sąmoningai išlaikome jį vienam elementui per sesiją, kad išvengtume konteksto lango išsiplėtimo - nauja kiekvienos programos sesija reiškia, kad agentas lieka sutelktas. 2 etapas - Veiksmai (pakuotės kūrimas) Kai programa yra auth konfigūruota, ji yra pasirengusi antrajam etapui: kuriant veiksmus, kurie daro integraciją iš tikrųjų naudinga. Šablonas atspindi 1 fazę. Skriptas filtruoja programas, kuriose yra jungtis su auth, bet dar nėra paketo, tada gimdo agentą kiekvienam. Kiekvienas agentas žino savo jungties ID ir jam liepiama įgyvendinti paketą. Jis tiria programos API, nustato populiariausius ir naudingiausius galutinius taškus ir sukuria veiksmų apibrėžimus - pilnas su įvesties schemomis, API prašymo konfigūracija, išvesties schemomis ir neprivalomomis elgesio gairėmis. Po patvirtinimo (patikrindamas, kad paketas iš tikrųjų turi veiksmų), jis skelbiamas ir skelbiamas viešai. Architektūra Štai kaip atrodo visa sistema, kai priartinate: Svarbiausios techninės detalės Konkurse 5–10, mes atliekame procesą Štai kas daro šį darbą patikimą: ~100 apps per batch run Sesijos stebėjimas Kiekviena agento sesija yra stebima mūsų debesyje, net jei agentai veikia vietoje partijų kūrimo metu.Skriptas sukuria sesijas mūsų platformoje ir po kiekvieno agento pabaigos ir sinchronizuoja visus pokalbių pranešimus. Tai reiškia, kad mes galime peržiūrėti kiekvieną AI sprendimą per mūsų konsolės naudotojo sąsają, lyg tai būtų debesies prieglobos sesija. Validacija ir klaidų tvarkymas Ne kiekviena programa gali būti automatizuota. scenarijus tvarko nesėkmę gražiai: Schemos patvirtinimas: po to, kai agentas baigiasi, mes patvirtiname rezultatą prieš mūsų SDK schemas. Jei jis nepatenka (trūksta reikiamų laukų, neteisinga struktūra), programa yra žymima. Negyvojo API: Agentui nurodoma palikti auth tuščią ir paaiškinti, kodėl, jei API yra nepasiekiama. Jei Claude patenka į ypač sudėtingą API (nors tai neįvyksta dažnai), sesija pažymėta kaip nesėkminga ir gali būti atnaujinta. Štai kur jis tampa įdomus: nesėkmės grįžta į tobulinimą.Kai agentas nepavyksta programoje, mes peržiūrime sesiją, kad suprastume, kodėl - ar tai buvo agentų įgūdžių spragos? Keistas API modelis? Blogi dokumentai? Mes išsprendžiame pagrindinę problemą, pakartotinai paleidžiame ir kiekviena partija tampa geresnė nei paskutinė. Agentūros žinios Tai yra raktas: agentas nepradeda nuo nulio kiekvienam API. Membranos platformos apžvalga (kas yra Membrane, kaip veikia sistema) "Connector building" įgūdžiai (patentuotas žingsnis po žingsnio darbo eiga, skirta auth įgyvendinimui. nustatyti auth tipą, skaityti auth tipo specifinius dokumentus, konfigūruoti parametrus, įgyvendinti API klientą, įgyvendinti testą) „OpenAPI“ įgūdžiai (kaip rasti ir palaipsniui užklausti „OpenAPI“ specifikacijas, neįkeliant visą schemą į kontekstą); Išsamūs pagrindinių jungiamųjų funkcijų įgyvendinimo vadovai. Mūsų agento sistema palaiko pagal poreikį įgūdžių įkrovimą sesijos metu, tačiau partijų apdorojimui mes nustatėme, kad raktinių įgūdžių išankstinis įkrovimas tiesiai į sistemos skambutį veikia geriau. Tai reiškia, kad agentas turi gilių žinių apie mūsų platformos modelius prieš net žiūrėdamas į tikslinį API. Rankinis sluoksnis Ne viskas yra visiškai automatizuota – ir tai yra pagal dizainą. "Edge" atvejai: kai kurie API yra nedokumentuoti, bet funkcionalūs. mes juos atradome peržiūros metu ir tvarkėme rankiniu būdu. Kokybės peržiūra: peržiūrime agentų sesijas per mūsų konsolę, ypač programoms, kuriose patvirtinimas nepavyko. Nėra realių įgaliojimų: šiuo metu agentas nepatvirtina naudojant realius API raktus. Jis tikrina, kad API yra pasiekiami ir kad auth yra teisingai konfigūruotas, bet neužbaigia realių OAuth srautų. Kas bus toliau Artimiausiomis savaitėmis mes viešai pradėsime "Membrane Universe", pradedant nišomis ir neaiškiomis programomis - senosios mokyklos API, blogai dokumentuotomis sistemomis. Šiuo metu didžiausias trūkumas yra tikrasis įgaliojimų testavimas.Mes kuriame naršyklės automatizavimą automatiniam prisijungimui ir OAuth srautams, kad agentai galėtų patikrinti integracijas nuo galo iki galo. Ilgesnis laikotarpis: nuolatinė priežiūra. API keičiasi, galutiniai taškai išnyksta. Tie patys agentai, kurie sukūrė šias integracijas, išlaikys juos dabartinius. Didesnis vaizdas yra toks: AI agentai yra ne tik kodavimo padėjėjai, kurie padeda jums rašyti funkcijas greičiau. Nurodykite jiems gerai apibrėžtą problemą, suteikite jiems tinkamas priemones ir žinias, ir jie gali kurti dalykus tokiu mastu, kuris anksčiau nebuvo įmanomas. infrastructure builders