E-mail-ul care a rupt producția O companie de tehnologie juridică din seria B a desfășurat un agent AI pentru a gestiona escaladările revizuirii contractelor. Agentul avea acces la fiecare bilet de asistență, la fiecare fir de e-mail al clientului și la o bază de cunoștințe de 200 de pagini. Agentul prindea cazuri de margine, semnalând riscuri, oferind îndrumări exacte. Day one: Agentul a început să se contrazică prin fire. Day three: Spunând cu încredere clienților lucruri care contrazic în mod direct deciziile luate cu două săptămâni mai devreme în schimburile de e-mailuri, nu a putut să analizeze. Day seven: Problema nu a fost modelul. GPT-5 este excelent în analiza contractului atunci când îl hrăniți cu un contract curat. Problema a fost că agentul nu a avut nicio idee despre ceea ce sa întâmplat de fapt. Nu a putut reconstrui istoricul conversației. Nu a putut spune că atunci când vicepreședintele produsului a spus "să ne oprim asupra acestui lucru" în mesajul 6 al unui fir de e-mail 18 , acea decizie a înlocuit tot ceea ce a venit înainte. Nu a putut detecta că trei zile de tăcere după "Mă voi uita la asta" a însemnat că problema a fost abandonată, nu a fost rezolvată. Agentul a fost genial în izolare și complet pierdut în context. Paradoxul care ucide Enterprise AI Iată ce încalcă cele mai multe proiecte AI de întreprindere înainte de a le trimite: CRM-ul dvs. este structurat. tablourile dvs. sunt structurate. listele dvs. de sarcini sunt structurate. Nimic din acest lucru nu este în cazul în care deciziile reale au loc de fapt. Deciziile reale apar în e-mailuri în care concluzia evoluează în 47 de răspunsuri, în dezbateri Slack în care cineva spune "nvm" și inversează trei zile de planificare, în Google Docs cu războaie de comentarii îngropate în margini, în lanțuri redirecționate în care decizia reală este în mesajul 3 din 11 și totul altceva este doar contextul de care aveți nevoie pentru a înțelege de ce. Acest lucru este tulburător, recursiv, plin de semnificație implicită și intenție nedeclarată. Oamenii o navighează bine pentru că urmărim automat continuitatea narativă. Știm că atunci când Sarah spune "o să tratez acest lucru" într-un singur fir și apoi tace timp de trei săptămâni într-un fir legat, există un blocator pe care trebuie să-l supraviețuim. AI nu știe acest lucru. AI vede jetoane, nu povestiri. E-mailul este locul unde AI va muri E-mailul este brutal dificil din aceleași motive pentru care este brutal valoros: Răspunsurile includ fragmente pe jumătate citate, creând o structură recursivă. Forwards creează fire de fir în care conversațiile se ramifică în liniile de timp paralele. Participanții se alătură mijlocului contextului, așa că "am decis" înseamnă grupuri diferite la puncte diferite. Tone schimbă riscul de semnal, trei răspunsuri "suna bine" urmat de "de fapt, o întrebare rapidă" înseamnă de obicei că o afacere este dezlănțuită. Atașamentele poartă logica de afaceri, dar sunt trimise indirect. Oamenii spun "o voi trimite vineri" în loc de "sarcină atribuită cu termenul limită de 22 noiembrie" E-mailul nu este text, e-mailul este o arhitectură de conversație înfășurată în jurul textului. Înțelegerea acesteia necesită reconstruirea logicii conversației, nu doar prelucrarea propozițiilor. Așa că toată lumea încearcă aceleași patru soluții, toate eșuează din același motiv. Soluțiile greșite pe care toată lumea le încearcă mai întâi Pune totul în prompt Teoria: dați LLM tot contextul și lăsați-l să-l descopere. Rezultatul: lent, scump, fragil, predispus la halucinații. LLM-urile nu se îmbunătățesc cu mai multe jetoane – se îneacă. Un fir de e-mail de 50 de ori are poate 3 e-mailuri care contează și 47 de ori care sunt conversaționale. Modelul nu poate spune diferența. cântărește totul în mod egal, devine confuz de contradicții și inventează o concluzie care sună plauzibilă, dar nu reflectă nimic din ceea ce sa întâmplat de fapt. RAG (generație extinsă de recuperare) Teoria: obțineți e-mailuri relevante, lăsați căutarea semantică să se ocupe de restul. Rezultatul: minunat pentru documente, teribil pentru conversații. RAG poate recupera cele cinci e-mailuri cele mai relevante. Dar nu vă poate spune că răspunsul de pe linia 47 contrazice concluzia de mai sus. Nu poate detecta că "soară bine" de la CFO înseamnă aprobare în timp ce "soară bine" de la un intern nu înseamnă nimic. RAG îți dă bucăți. Ai nevoie de narativ. Acestea nu sunt același lucru. Fine tuning Teoria: instruiți modelul pe modelele dvs. de comunicare. Rezultatul: un papagal mai inteligent, nu un istoric mai bun. Fine-tuning-ul poate face un LLM mai bun în extragerea elementelor de acțiune din fraza echipei dvs. Dar nu va ajuta modelul să înțeleagă că atunci când Sarah se angajează la ceva în Thread A și apoi tace în Thread B despre același subiect timp de trei săptămâni, există un blocator despre care trebuie să știți. Nu vă puteți ajusta modul în care să înțelegeți conversațiile live, în continuă schimbare, cu mai mulți participanți, care se întind pe săptămâni și se extind prin instrumente. Clasamente personalizate Am încercat asta, toată lumea încearcă asta. În cele din urmă construiți un zoo de micro-detectoare slabe: clasificatoare de sentimente, extractoare de sarcini, markeri de decizie, identificatori de proprietari, analizoare de termen, semnale de risc, analizoare de ton. Acestea sunt în regulă individual. Împreună sunt fragile, contradictorii și rup momentul în care cineva scrie "sigur, că funcționează" în loc de "aprobat" sau "nu sunt sigur despre asta" în loc de "Am preocupări". Clasificatorii nu vorbesc unul cu celălalt. Nu împărtășesc contextul. Nu înțeleg că aceeași frază înseamnă lucruri diferite în funcție de cine o spune și când. Petreci șase luni construindu-le și regândindu-le, și totuși le lipsește ceea ce contează: arcul narativ al conversației. Niciuna dintre aceste soluţii nu abordează problema reală. comunicarea umană nu este explicită. AI nu eșuează în răspunsuri, eșuează în presupuneri. Întrebați un LLM ce a decis echipa dvs. săptămâna trecută.Nu vă poate spune.Nu pentru că este rău la rezumat, ci pentru că nu are ipotezele necesare pentru a interpreta ceea ce sa întâmplat. Atunci când lipsește ipotezele corecte, e-mailurile inofensive arată furioase. O rutină de „continuare a acestui lucru” este etichetată ca fiind urgentă atunci când nu este. Angajamentele majore rămân neobservate deoarece sunt exprimate ca acorduri casual. Sarcinile coboară în tăcere pentru că „Mă voi uita” nu este recunoscută ca un angajament moale care are nevoie de urmărire. Oamenii urmăresc povestea de fundal în mod natural. Cunoaștem relațiile. Cunoaștem istoria. Știm că această persoană spune întotdeauna „lăsați-mă să mă gândesc la asta” atunci când ei spun nu, și acea persoană spune „da, poate” atunci când ei spun da. Maşinile au nevoie de ajutor.În special, au nevoie de structură. Ce am construit în schimb: un motor de context În schimb, am construit un motor care transformă comunicarea nestructurată în inteligență structurată înainte de a atinge vreodată un model. Gândiți-vă la ea ca la un preprocesor pentru conversația umană. Parsing profund și raționament Primul strat se ocupă de sincronizarea OAuth, retragerea în timp real, legarea atașamentelor, normalizarea mesajelor. Al doilea strat este în cazul în care devine dificil: analizarea răspunsurilor încorporate, avansuri, citări în linie, schimbări ale participanților, decalaje de timp, rezoluție de referință. Când cineva spune "a se vedea atașat", sistemul trebuie să știe ce atașament de la care mesaj trimis de către care persoană la ce punct. Stratul de raționament modelează conversația ca o diagramă, nu ca o listă. Fiecare mesaj este un nod. Răspunsurile creează margini. Înainte creează noi subgrafuri. Sistemul urmărește sentimentele în timp ca tendințe, nu etichete statice. Acesta urmărește angajamentele și dacă acestea sunt urmărite. Detectează când tonul se schimbă de la colaborativ la defensiv. Flags atunci când cineva ia o decizie și apoi o contrazice trei zile mai târziu. Acesta extrage sarcini, cum ar fi angajamentele cu proprietarii, termenele limită implicite și contextul. Înțelege că „Nu sunt sigur că acest lucru este corect” înseamnă lucruri diferite în funcție de cine o spune și când. De la un inginer junior cu două zile înainte de lansare, este un flag-for-review. De la CTO trei săptămâni într-un proiect, este un stop-and-rethink. Producția structurată Motorul returnează JSON curat, previzibil: decizii cu timestamp-uri și participanți, sarcini cu proprietari și termene limită, riscuri cu punctajele de severitate și tendințe, analiză sentimentală care arată modul în care evoluează discuțiile, blocanți atunci când angajamentele tac. În loc să încerce să interpreteze "să ne revedem săptămâna viitoare", ei primesc o sarcină structurată cu un termen-limită implicit și un semn că aceasta este o amânare ușoară, nu un angajament greu. Ce am învățat să construim Oamenii nu vorbesc în modele de citire automată Jumătate din comunicarea de afaceri este ambiguitate politicoasă. „Got it.” „Funcționează pentru mine.” „Să revedem acest lucru.” Nu există angajamente explicite. Toate implică ceva, dar ceea ce implică depinde de contextul pe care nu îl puteți obține din text singur. Fixarea nu a fost o mai bună potrivire a tiparelor. a fost construirea unui sistem care reconstruiește mai întâi contextul, apoi interpretează tiparele din acest context. Conversațiile nu sunt liniare, sunt copaci. Cineva CCs o persoană nouă, și acum există două discuții paralele în ceea ce arată ca un singur fir. Trebuie să reconstruiți întregul grafic, nu să citiți secvențial. Nu puteți procesa e-mailul ca o listă. Trebuie să îl procesați ca un grafic aciclic direcționat cu mai multe rădăcini, urmărind care ramuri sunt active și care sunt abandonate. Structura firului de e-mail (ce vede AI de fapt) Message 1 ─┐

├─ Reply 2 ── Reply 4 ── Reply 7

└─ Reply 3 ──┐

├─ Forwarded Chain → Reply 5

└─ Reply 6 (new participant) ── Reply 8
 Ramificații active: 7, 8 Abandonat : 5 Decizia luată în: 7 (discutarea contradicțiilor în ramura 3→6) Sentimentul nu este static Un singur e-mail calm nu înseamnă nimic.O tendință descrescătoare de-a lungul săptămânilor înseamnă totul. Semnalul nu este în mesajul individual - este în traiectorie. Trei e-mailuri "suna bine" urmată de "într-adevăr, o întrebare rapidă" este un indicator principal că o afacere se dezlănțuie. Agenții eșuează pentru că le lipsește continuitatea istoriei Acesta este motivul pentru care copiloții AI se simt inteligenți în prima zi și proști în a zecea zi.Nu își amintesc ce sa întâmplat.Nu urmăresc modul în care au evoluat deciziile.Trată fiecare conversație ca fiind izolată, atunci când fiecare conversație face parte dintr-o poveste mai mare. Remediul a fost de a construi o memorie care persistă prin conversații și instrumente.Nu numai "aici este ceea ce am discutat", ci "aici este ceea ce am decis, cine s-a angajat la ce, ce este încă deschis, ce sa schimbat, ce a fost abandonat". Continuitatea poveștii este diferența dintre un AI care ajută și un AI care confundă. Producător Takeaways Structura conversației este prea complexă, prea recursivă, prea contextuală pentru potrivirea tiparelor. Continuitatea narativă contează mai mult decât numărul de jetoane. Stuffing 50 de e-mailuri într-un prompt dă modelului zgomot, nu context. Ei vor fi strălucitori în prima zi și incoerenți în a zecea zi, deoarece nu au memorie de decizii, nici urmărire a angajamentelor, nici conștientizare a modului în care au evoluat conversațiile. GPT-5 este excelent în raționament atunci când îi dați o intrare curată, structurată. Acest strat trebuie să existe undeva. fie îl construiți singur (luni de muncă, întreținere continuă, cazuri de margine nesfârșite) sau utilizați infrastructura care o gestionează deja. De ce ar trebui să aibă grijă dezvoltatorii Dacă construiți cu cadre LangChain, LangGraph, LlamaIndex sau agenți particularizați, în cele din urmă atingeți același zid de cărămidă: modelul are nevoie de context structurat, nu de text crud. Fiecare produs AI care atinge comunicarea umană are nevoie de acest lucru. AI care nu poate urmări istoria escaladării este inutilă. AI legală care nu poate reconstrui istoria negocierilor contractuale nu poate evalua riscul. Totul se rupe fără context structurat.Acesta este stratul lipsă. Am petrecut trei ani construindu-l pentru că e-mailul este produsul nostru de bază. Cei mai mulți dezvoltatori nu au trei ani. Aplicația Email Intelligence API Sistemul pe care l-am construit este disponibil sub forma API-ului Email Intelligence, care ia e-mailul brut și returnează semnale structurate, gata de raționament. Obțineți înapoi sarcini cu proprietarii și termenele limită, decizii cu participanții și istoria, riscuri marcate și urmărite în timp, tendințe sentimentale, blocanți identificați atunci când angajamentele sunt tăcute. Nu există lanțuri prompte. Nu există rezultate RAG. Nu se construiesc clasificatoare personalizate timp de șase luni. Dezvoltatorii o integrează în mai puțin de o zi. Procesează milioane de e-mailuri lunar cu o precizie de 90%+ la extragerea deciziilor și identificarea sarcinilor. Dacă construiți instrumente AI care ating e-mailul, chat-ul sau docurile, acesta este stratul pe care nu doriți să-l construiți. Schimbarea mai mare Următorul val de AI nu va fi despre modele mai mari, ci despre un context mai bun. Cele mai multe echipe încearcă încă să îmbunătățească invitațiile, încercând să obțină GPT-5 să fie cu 5% mai bine la rezumarea firelor de e-mail dezordonate. Lipsa de sticlă nu este modelul. Lipsa de sticlă este că modelul nu are nicio idee despre ce se întâmplă. este orb la istoria ta, relațiile tale, deciziile tale, angajamentele tale. Contextul nu vine de pe web.Contextul nu vine de la modele mai mari.Contextul vine de la munca ta – iar munca ta este blocata in comunicarea nestructurata pe care AI nu o poate analiza fara ajutor. Corectați-o, iar AI încetează să sune inteligent și începe să fie util. API-ul Email Intelligence face parte din motorul de context al iGPT pentru dezvoltatorii de AI. Dacă aceasta este problema pe care o rezolvați, am construit deja infrastructura.

Read My Stories

Acest audio este produs în limba originală a poveștii!

Nu ai o problemă rapidă, ai o problemă de context.

About Author

COMENTARII

Etichete suspendate

ACEST ARTICOL A FOST PREZENTAT IN

Related Stories

The #bitcoin Writing Contest by Rootstock and HackerNoon: Round 1 Results 🎉

The Spacecoin Writing Contest by Spacecoin and HackerNoon: Round 1 Results 🎉

Can Bitcoin Hit 1 Million Dollars?

Design Shifts at HackerNoon: Streamlined Top Nav, Quick Search and Settings Dashboard 🚀

The #bitcoin Writing Contest by Rootstock and HackerNoon: Round 1 Results 🎉

The Spacecoin Writing Contest by Spacecoin and HackerNoon: Round 1 Results 🎉

Can Bitcoin Hit 1 Million Dollars?

Design Shifts at HackerNoon: Streamlined Top Nav, Quick Search and Settings Dashboard 🚀

Light-Mode

Classic

Newspaper

Minty

Dark-Mode

Neon Noir

Minty

HN StartUps