E-pasta pavedieni, kas pārtrauca ražošanu B sērijas juridisko tehnoloģiju uzņēmums izvietoja AI aģentu, lai risinātu līguma pārskatīšanas eskalācijas. aģentam bija piekļuve katrai atbalsta biļetei, katram klientu e-pasta virzienam un 200 lappušu zināšanu bāzei. Aģents nozvejoja malas gadījumus, apzīmēja riskus, sniedzot precīzus norādījumus. Day one: Agents sāka pretrunā ar sevi caur virzieniem. Day three: pārliecinoši stāstot klientiem lietas, kas tieši pretrunā lēmumiem, kas pieņemti divas nedēļas agrāk e-pasta apmaiņās, to nevarēja analizēt. Day seven: Problēma nebija modelis. GPT-5 ir lielisks līguma analīzē, kad jūs to barojat ar tīru līgumu. Problēma bija tā, ka aģentam nebija ne jausmas par to, kas faktiski notika. Tas nevarēja rekonstruēt sarunu vēsturi. Tas nevarēja pateikt, ka, kad produkta VP teica: "Let's hold on this" ziņojumā 6 no 18 e-pasta stieņa, šis lēmums aizstāja visu, kas nāca pirms. Tas nevarēja atklāt, ka trīs dienu klusums pēc "Es apskatīšu šo" nozīmēja, ka problēma tika pamesta, nav atrisināta. Agents bija izcils izolācijā un pilnīgi pazudis kontekstā. Paradokss, kas nogalina uzņēmumu AI Šeit ir tas, kas pārkāpj lielāko daļu uzņēmējdarbības AI projektu, pirms tie pat kuģo: Jūsu CRM ir strukturēts. Jūsu instrumentu plāksnes ir strukturētas. Jūsu uzdevumu saraksti ir strukturēti. Neviens no tiem nav tas, kur reāli lēmumi patiešām notiek. Reālie lēmumi notiek e-pasta virzienos, kur secinājums attīstās 47 atbildēs, Slack debatēs, kur kāds saka "nvm" un atgriež trīs dienu plānošanu, Google Dokumentos ar komentāru kariem, kas apglabāti maržās, novirzītajās ķēdēs, kur faktiskais lēmums ir ziņojumā 3 no 11 un viss pārējais ir tikai konteksts, kas jums ir nepieciešams, lai saprastu, kāpēc. Cilvēki to labi pārvieto, jo mēs automātiski izsekojam stāstījuma nepārtrauktībai. Mēs zinām, ka, kad Sarah saka "es to risināšu" vienā virzienā un pēc tam klusē trīs nedēļas saistītajā virzienā, ir bloķētājs, kas mums ir nepieciešams, lai virsma. AI to nezina. AI redz zīmes, nevis stāstu. E-pasts ir vieta, kur AI iet mirt E-pasts ir brutāli grūts tā paša iemesla dēļ, ka tas ir brutāli vērtīgs: Atbildes ietver daļēji citētus fragmentus, radot atkārtojošu nested struktūru. Forwards izveido virves, kurās sarunas tiek nodalītas paralēlās laika joslās. Dalībnieki pievienojas viduskontekstam, tāpēc "mēs nolēmām" nozīmē dažādas grupas dažādos punktos. Tona maiņas signāla risks, trīs "skan labi" atbildes, kam seko "patiesībā, ātrs jautājums" parasti nozīmē, ka darījums tiek atrisināts. Pielikumi nes biznesa loģiku, bet tiek atsaukti netieši. Cilvēki saka "Es nosūtīšu to piektdienā" nevis "uzdevums, kas piešķirts ar termiņu 22. novembrī". E-pasts nav teksts.E-pasts ir sarunu arhitektūra, kas iesaiņota ap tekstu. Lai to saprastu, ir nepieciešams rekonstruēt sarunu loģiku, nevis tikai apstrādāt teikumus. Tātad visi mēģina vienus un tos pašus četrus risinājumus. Nepareizie risinājumi visi mēģina vispirms Ielieciet visu promptā Teorija: dodiet LLM visu kontekstu un ļaujiet tai izdomāt to. Rezultāts: lēns, dārgs, trausls, halucinācijas pakļauts. LLM nesaņem labāk ar vairāk žetoniem - viņi noslīka. 50 e-pasta virzienā var būt 3 e-pasta ziņojumi, kas ir svarīgi, un 47, kas ir sarunas. modelis nevar pateikt atšķirību. tas svēra visu vienādi, kļūst sajaukts ar pretrunām un izgudro secinājumu, kas izklausās ticams, bet atspoguļo neko, kas faktiski notika. RAG (Retrieval-Augmented Generation) – atgūšanas paplašinātā paaudze Teorija: iegūt atbilstošus e-pastus, ļaujiet semantiskajam meklējumam pārējo. Rezultāts: lielisks dokumentiem, briesmīgs sarunām. RAG var iegūt piecus vispiemērotākos e-pastus.Bet tas nevar jums pateikt, ka atbilde uz līnijas 47 pretrunā secinājumam augšpusē.Tas nevar atklāt, ka "skan labi" no CFO nozīmē apstiprinājumu, bet "skan labi" no stažiera nozīmē neko. RAG dod jums gabalus. Jums ir nepieciešams stāstījums. Tie nav vienādi. Smalks tuning Teorija: apmācīt modeli uz jūsu komunikācijas modeļiem. Rezultāts: gudrāks papagailis, nevis labāks vēsturnieks. Tomēr tas nepalīdzēs modelim saprast, ka, kad Sarah apņemas kaut ko Thread A un pēc tam klusē Thread B par to pašu tēmu trīs nedēļas, ir bloķētājs, par kuru jums ir jāzina. Jūs nevarat viegli pielāgot savu ceļu, lai saprastu dzīvas, pastāvīgi mainīgas, vairāku dalībnieku sarunas, kas aptver nedēļas un nozarē dažādus rīkus. Custom klasifikācijas Mēs to mēģinājām, visi to mēģina. Jūs galu galā veidojat zooloģisko dārzu ar vājiem mikro-detektoriem: noskaņojumu klasifikatoriem, uzdevumu ekstraktoriem, lēmumu marķieriem, īpašnieka identifikatoriem, termiņa analīziem, riska signāliem, toni analīziem. Tie ir individuāli labi. Kopā viņi ir trausli, pretrunīgi, un viņi pārtrauc brīdi, kad kāds raksta "jā, tas darbojas" nevis "apstiprināts" vai "nav pārliecināts par to", nevis "Man ir bažas". Viņi nesaprot, ka viena un tā pati frāze nozīmē dažādas lietas atkarībā no tā, kurš to saka un kad. Jūs pavadāt sešus mēnešus, veidojot un pielāgojot tos, un viņiem joprojām pietrūkst tas, kas ir svarīgi: sarunas stāstījuma loks. Neviens no šiem risinājumiem neatrisinās faktisko problēmu. Cilvēka komunikācija nav skaidra. AI neizdodas atbildēs, tas neizdodas pieņēmumos. Jautājiet LLM, ko jūsu komanda nolēma pagājušajā nedēļā.Tas nevar pateikt jums.Ne tāpēc, ka tas ir slikts kopsavilkums, bet tāpēc, ka tam nav pieņēmumu, kas vajadzīgi, lai interpretētu notikušo. Kad jums trūkst pareizo pieņēmumu, nekaitīgi e-pasta ziņojumi izskatās dusmīgi. Rutīns "turpināt šo" tiek atzīmēts kā steidzams, kad tas nav. Lielās saistības paliek nepamanītas, jo tās ir izteiktas kā nejaušas vienošanās. Uzdevumi klīst klusi, jo "Es paskatīšos" netiek atzīts par mīkstu saistību, kurai nepieciešama izsekošana. Darījumi paliek, jo aģents neatrod, ka trīs pieklājīgi e-pasta ziņojumi pēc kārtas bez konkrētiem nākamajiem soļiem nozīmē, ka perspektīva ir spoku. Mēs zinām vēsturi.Mēs zinām, ka šī persona vienmēr saka "ļauj man par to domāt", kad viņi domā nē, un šī persona saka "jā, varbūt", kad viņi domā jā. Mašīnām ir nepieciešama palīdzība, īpaši tām ir nepieciešama struktūra. Ko mēs veidojam tā vietā: konteksta dzinējs Mēs pārtraucām mēģināt padarīt LLM maģiski saprast neapstrādātu e-pastu. Padomājiet par to kā par cilvēka sarunas priekšprocesoru. Dziļa analīze un pamatojums Pirmais slānis nodarbojas ar OAuth sinhronizāciju, reāllaika vilkšanu, pielikumu savienošanu, ziņojumu normalizāciju. Otrs slānis ir tas, kur tas kļūst grūti: analīze nested atbildes, virzieni, inline citēšana, dalībnieku izmaiņas, laika atšķirības, atsauces izšķirtspēja. kad kāds saka "skatīt pielikts", sistēmai ir jāzina, kurš pielikums no kura ziņojuma nosūtīts, kuru personu kādā brīdī. Pamatojuma slānis modelē sarunu kā grafiku, nevis sarakstu. Katrs ziņojums ir mezgls. Atbildes rada malas. Uz priekšu izveido jaunas apakšgrāmatas. Sistēma laika gaitā izseko noskaņojumu kā tendences, nevis statiskas etiķetes. Tā izseko saistības un to, vai tās tiek sekotas. Tā atklāj, kad tonis mainās no sadarbības uz aizsardzību. Tā karogi, kad kāds pieņem lēmumu, un pēc tam to pretrunā trīs dienas vēlāk. Tā atzīmē, kad uzdevums ir piešķirts un pēc tam klusi atstāts. Tas iegūst uzdevumus, piemēram, saistības ar īpašniekiem, netiešos termiņus un kontekstu. Tas saprot, ka "es neesmu pārliecināts, ka tas ir pareizi" nozīmē dažādas lietas atkarībā no tā, kurš to saka un kad. No junior inženieris divas dienas pirms uzsākšanas, tas ir flags-for-review. Strukturēts iznākums Dzinējs atgriež tīru, paredzamu JSON: lēmumi ar laika zīmēm un dalībniekiem, uzdevumi ar īpašniekiem un termiņiem, riski ar smaguma rādītājiem un tendencēm, noskaņojuma analīze, kas parāda, kā attīstās diskusijas, bloķētāji, kad saistības klusē. Tā vietā, lai mēģinātu interpretēt "mēs atgriezīsimies nākamnedēļ," viņi saņem strukturētu uzdevumu ar netiešo termiņu un karogu, ka tas ir mīksts atlikums, nevis grūta apņemšanās. Ko mēs iemācījāmies to veidot Cilvēki nerunā mašīnlasāmos modeļos Puse no uzņēmējdarbības komunikācijas ir pieklājīga neskaidrība. „Iegūstiet to.” „Darbojas man.” „Mēs to atkārtojam.” Neviens nav skaidrs apņemšanās. Viss nozīmē kaut ko, bet tas, ko tie nozīmē, ir atkarīgs no konteksta jūs nevarat iegūt no teksta vien. Tas bija izveidot sistēmu, kas vispirms rekonstruē kontekstu, pēc tam interpretē modeļus šajā kontekstā. Sarunas nav lineāras, tās ir koki. Reply trees fork. Forwards izveido alternatīvas laika līnijas. Kāds CCs jaunu personu, un tagad ir divas paralēlas diskusijas par to, kas izskatās kā viens virziens. Jums ir jāpārstrādā viss grafiks, nevis jāizlasa secīgi. Jūs nevarat apstrādāt e-pastu kā sarakstu. Jums tas ir jāapstrādā kā novirzīts acikliskais grafiks ar vairākiem saknēm, izsekojot, kuras filiāles ir aktīvas un kuras tiek pamestas. E-pasta tīkla struktūra (ko AI faktiski redz) Message 1 ─┐ ├─ Reply 2 ── Reply 4 ── Reply 7 └─ Reply 3 ──┐ ├─ Forwarded Chain → Reply 5 └─ Reply 6 (new participant) ── Reply 8 Aktīvās filiāles: 7, 8 Atstāti: 5 Lēmums, kas pieņemts: 7 (pretrunu apspriešana 3. iedaļā→6) Emocijas nav statiskas Viena mierīga e-pasta vēstule nenozīmē neko.Nākamā tendence nedēļās nozīmē visu. Signāls nav atsevišķā ziņojumā - tas ir trajektorijā. Trīs "skan labi" e-pasta ziņojumi, kam seko "patiesībā, ātrs jautājums" ir vadošais rādītājs, ka darījums tiek atrisināts. Agenti neizdodas, jo viņiem trūkst stāsta nepārtrauktības Tāpēc AI copilots jūtas gudrs pirmajā dienā un stulbs desmitajā dienā.Viņi neatceras, kas notika.Viņi neseko, kā lēmumi attīstījās.Viņi izturas pret katru sarunu kā izolētu, kad katra saruna ir daļa no lielāka stāsta. Risinājums bija veidot atmiņu, kas saglabājas visās sarunās un instrumentos.Ne tikai "tas ir tas, ko mēs apspriedām", bet "tas ir tas, ko mēs nolēmām, kas apņēmās ko, kas joprojām ir atvērts, kas mainījās, kas tika atstāts." Stāsta nepārtrauktība ir atšķirība starp AI, kas palīdz, un AI, kas sajauc. Izstrādātājs Takeaways Jūs nevarat pārbūvēt e-pasta analīzi ar regex. sarunu struktūra ir pārāk sarežģīta, pārāk rekurējoša, pārāk kontekstveida, lai pielāgotu modeli. Narratīvā nepārtrauktība ir svarīgāka par žetonu skaitīšanu. 50 e-pasta ziņojumi, kas tiek ievietoti brīdī, sniedz modelim troksni, nevis kontekstu. Viņi būs izcili pirmajā dienā un nesaskaņoti desmitajā dienā, jo viņiem nav atmiņas par lēmumiem, nav saistību izsekošanas, nav izpratnes par to, kā sarunas attīstījās. Pudele nav modelis. GPT-5 ir lielisks pamatojums, kad jūs to darāt tīru, strukturētu ievadi. Šim slānim kaut kur ir jābūt. vai nu jūs to izveidojat pats (mēnešu darbs, nepārtraukta apkope, bezgalīgi malkas gadījumi), vai arī jūs izmantojat infrastruktūru, kas to jau apstrādā. Kāpēc izstrādātājiem vajadzētu rūpēties Ja jūs veidojat ar LangChain, LangGraph, LlamaIndex vai pielāgotu aģentu sistēmām, jūs galu galā sasniedzat to pašu ķieģeļu sienu: modelim ir nepieciešams strukturēts konteksts, nevis neapstrādāts teksts. Katram AI produktam, kas pieskaras cilvēka komunikācijai, tas ir nepieciešams. Klientu atbalsta AI, kas nevar izsekot eskalācijas vēsturei, ir bezjēdzīgs. Juridiskais AI, kas nevar rekonstruēt līgumu sarunu vēsturi, nevar novērtēt risku. Viss tiek pārtraukts bez strukturēta konteksta. Mēs pavadījām trīs gadus, lai to izveidotu, jo e-pasts ir mūsu galvenais produkts. Lielākajai daļai izstrādātāju nav trīs gadu. E-pasta izlūkošanas API Sistēma, kuru mēs izveidojām, ir pieejama kā E-pasta izlūkošanas API. Tā ņem neapstrādātu e-pastu un atgriež strukturētus, pamatojuma gatavus signālus. Jūs atgriežat uzdevumus ar īpašniekiem un termiņiem, lēmumus ar dalībniekiem un vēsturi, risku, kas tiek sasniegts un izsekots laika gaitā, sentimentālās tendences, bloķētāji, kas identificēti, kad saistības klusē. Nav ātrās ķēdes. Nav RAG rezultātu. Nav sešu mēnešu laikā izveidot pielāgotus klasifikatorus. Izstrādātāji to integrē mazāk nekā vienā dienā.Tas katru mēnesi apstrādā miljonus e-pasta ziņojumu ar 90%+ precizitāti lēmumu iegūšanā un uzdevumu identificēšanā. Ja jūs veidojat AI rīkus, kas pieskaras e-pastiem, tērzēšanai vai dokumentiem, tas ir slānis, kuru jūs nevēlaties veidot pats. Lielākās pārmaiņas Nākamais AI vilnis nebūs par lielākiem modeļiem, tas būs par labāku kontekstu. Lielākā daļa komandu joprojām cenšas uzlabot uzaicinājumus, cenšoties GPT-5 padarīt par 5% labāku neskaidru e-pasta virzienu apkopošanā. Bottleneck nav modelis. Bottleneck ir tas, ka modelim nav ne jausmas, kas notiek. tas ir akls jūsu vēsturei, jūsu attiecībām, jūsu lēmumiem, jūsu saistībām. Konteksts nenāk no tīmekļa. Konteksts nenāk no lielākiem modeļiem. Konteksts nāk no jūsu darba - un jūsu darbs ir iestrēdzis nestrukturētā komunikācijā, ko AI nevar analizēt bez palīdzības. Izlabojiet to, un AI pārtrauc izklausīties gudri un sāk būt noderīgs. E-pasta izlūkošanas API ir daļa no iGPT kontekstuālā dzinēja AI izstrādātājiem.Ja šī ir problēma, kuru jūs risināt, mēs jau esam izveidojuši infrastruktūru.