Every morning, millions of people open their phones to the same thing: a flood of headlines. Global politics, tech announcements, market swings, and local stories all compete for attention. Most of it isn’t relevant — but buried somewhere are the few stories that truly matter. Jums reikia gerai suprojektuotų įrankių, turinčių stiprių pamatų: sistemų, kurios gali surinkti informaciją, ją apdoroti, praturtinti struktūra ir pateikti ją taip, kad atitiktų jūsų kontekstą. Kaip agentai Pagalvokite apie paprastas funkcijas, kurios gali atlikti RPC / API skambučius, gauti duomenis iš šaltinio, apdoroti jį ir perduoti jį LLM arba perduoti kitiems agentams daugiau apdorojimo. Didžiųjų kalbų modelių kontekste agentas paprastai: Atpažįsta per įvestis, pvz., paieškos rezultatus, API arba naudotojo instrukcijas. with the help of an LLM, deciding what to prioritize. Reasons Veikia skambindami įrankius, paleidžiant kodą arba pateikiant rezultatus. Jei kada nors pasiruošėte sistemų dizaino interviu, jūs žinote, kad pašarų dizainas visada pasirodo: "Facebook News Feed", "Twitter" laiko juosta arba (jei esate 90 metų vaikas) RSS skaitytuvai. Paprastas personalizuotas naujienų agentas Įsivaizduokite, kad pasakėte agentui, kad jums rūpi tam tikri ženklai: Jis daro tris dalykus: AI, „Apple“ ir „Bay Area“ istorijos Ištraukite geriausias naujienas iš interneto. Filtruokite rezultatus pagal tuos raktinius žodžius. Suskirstykite juos į greitą digestą. Vieną dieną jis gali suteikti jums: „Apple“ pristatė naują įrenginio AI modelį „Siri“ ir „iOS“ programoms. „Bay Area“ geležinkelio plėtros projektas užtikrina finansavimą. Rinkos atvėsina, nes AI lustų paklausa sulėtėja po praėjusio ketvirčio augimo. Tai jau yra naudinga. ugniasienis yra sumažintas iki valdomo sąrašo. bet jis yra plokščias. Jūs nežinote, kodėl istorija yra svarbi, ar kaip ji jungiasi su kitais. Įvairių agentų įvedimas Vietoj to, kad pasikliauti vienu monolitiniu agentu, kuris viską atlieka nuo galo iki galo, mes galime suskirstyti darbo eigą Tai yra tas pats principas kaip ir naujienų salėje: žurnalistai renka žaliavą, mokslininkai ją užrašo, analitikai pateikia kontekstą, o redaktoriai ją supakuoja skaitytojams. specialist agents Mūsų naujienų kanale tai atrodo taip: „Fetcher Agent“ – gauna visus naujienų straipsnius iš šaltinių ar API. Passage Extractor Agent – pabrėžia svarbiausius kiekvieno straipsnio skyrius. Pavadintas subjektas ekstraktoriaus agentas - ištraukia minėtus žmones, įmones, vietas ir produktus. Entity Disambiguation Agent – užtikrina, kad „Apple“ yra „Apple Inc.“ , o ne vaisius. Entity Tagger Agent – priskiria struktūrizuotus žymenis (pvz., Organizacija: „Apple“, produktas: „iPhone“). Tema klasifikatoriaus agentas - nustato platesnes temas, tokias kaip AI, finansai, įlankos sritis. Sentiment & Stance Agent - nustato, ar aprėptis yra teigiama, neigiama ar neutrali. Žymos apibendrinimo agentas - sujungia subjektus, temas ir jausmus į teminius skyrius. Fakto patikrinimo agentas – patvirtina pretenzijas prieš patikimus šaltinius. Personalizavimo ir reitingavimo agentas - teikia pirmenybę istorijoms, atitinkančioms jūsų interesus ir istoriją. Digest Compiler Agent — surenka poliruotą digestą skaitytojui patogiu formatu. "Daily Digest Agent" - pristato galutinį paketą (į jūsų pašto dėžutę, "Slack" arba programą). Kai kurie iš šių agentų veikia (pavyzdžiui, dviprasmiškumas turi sekti ekstrahavimu), o kiti gali vykti (Tempinis klasifikavimas, nuotaikos analizė ir subjektų ištraukimas gali dirbti tuo pačiu metu) Rezultatas yra koordinuotas specialistų vamzdynas, kuris gamina daug turtingesnį ir labiau struktūrizuotą virškinimą nei bet kuris vienas agentas galėtų. sequentially in parallel Kas ateina ir kas išeina - agentų sąsajos Toliau pateiktoje lentelėje apibendrinama, ko kiekvienas agentas tikisi ir ką jis duos atgal. Aš taip pat bandžiau parodyti, kur agentai gali bendrauti su LLM, jei jiems reikia pagalbos. Agent Inputs Outputs LLM Needed? Fetcher News feed URL, RSS, API query Full article text, metadata (title, URL, timestamp, source) ❌ No — HTTP/API call Passage Extractor Full article text Key passages, passage embeddings ✅ Optional — LLM for salience, or embeddings/TF-IDF Named Entity Extractor Passages Entity list, spans, embeddings ❌/✅ — NER models are faster, LLM can catch novel entities Entity Disambiguation Entity list, context embeddings Resolved entities with canonical IDs (e.g., Wikidata Q312) ✅ Yes — reasoning helps resolve ambiguous names Entity Tagger Disambiguated entities Entities with categories (Org, Person, Product, Location) ❌ No — deterministic classification Topic Classifier Passages, embeddings Topic labels (AI, Finance, Bay Area) ❌/✅ — embeddings + clustering or LLM for nuance Sentiment & Stance Analyzer Passages, entities Sentiment score, stance (supportive/critical/neutral) ✅ Optional — LLM for nuance, or sentiment models for speed Tag Summarizer Tagged entities, topics, sentiment Structured summaries grouped by tag ✅ Yes — summarization requires LLM Fact-Checker Summaries, claims Verified/Unverified claims, supporting references ✅ Yes — requires claim extraction + retrieval reasoning Personalization & Ranking Validated summaries, user profile Ranked/weighted story list ❌ No — ML heuristics suffice Digest Compiler Ranked summaries Final formatted digest (Markdown, HTML, JSON) ❌/✅ — deterministic formatting, LLM optional for tone Daily Digest Compiled digest Delivery package (email, Slack, app notification) ❌ No — just delivery Fetcher Naujienų šaltinis URL, RSS, API užklausos Visas straipsnio tekstas, metaduomenys (pavadinimas, URL, laiko žymė, šaltinis) HTTP / API skambutis Passage Extractor Visas straipsnio tekstas Pagrindiniai perėjimai, įterpimai ✅ Pasirenkamasis - LLM iškyla, arba įterpimai / TF-IDF Named Entity Extractor Perėjimai Entity sąrašas, spansai, įterpimai 🔸/✅ — NER modeliai yra greitesni, LLM gali sugauti naujus subjektus Entity Disambiguation Subjektų sąrašas, kontekstiniai įterpimai Išspręsti subjektai su kanoniniais ID (pvz., Wikidata Q312) ✅ Taip – motyvavimas padeda išspręsti dviprasmiškus vardus Entity Tagger Dviprasmiški subjektai Subjektai su kategorijomis (organas, asmuo, produktas, vieta) Ne – deterministinė klasifikacija Topic Classifier Perėjimai, įdėklai Tema žymės (AI, finansai, įlankos sritis) /✅ — įterpimai + klasteris arba LLM atspalviai Sentiment & Stance Analyzer Įmonės, subjektai Nuotaikos įvertinimas, požiūris (pritarimas / kritinis / neutralus) ✅ Pasirinktinai - LLM atspalviai, arba sentimentalūs modeliai greičiui Tag Summarizer Tagged subjektai, temos, sentimentas Struktūrizuotos santraukos, suskirstytos pagal žymę ✅ Taip - apibendrinimas reikalauja LLM Fact-Checker Apibendrinimai, pretenzijos Patvirtinti / nepatvirtinti teiginiai, patvirtinantys nuorodas ✅ Taip – reikalauja pretenzijos ištraukimo + paieškos motyvacijos Personalization & Ranking Patvirtintos santraukos, naudotojo profilis Ranked / Svorio istorijos sąrašas Ne – ML heuristikos pakanka Digest Compiler Išdėstytos santraukos Galutinis formatuotas skaitymas (Markdown, HTML, JSON) /✅ — deterministinis formatavimas, LLM pasirenkamas tonui Daily Digest Sudėtingas digest Pristatymo paketas (paštas, „Slack“, pranešimai apie programą) Ne – tik pristatymas Kai kurie agentai reikalauja LLM argumentų, kiti yra lengvi ir deterministiniai. Šis suskirstymas yra svarbus: gamybai norėsite kuo mažiau LLM skambučių (siekiant sutaupyti sąnaudų ir vėlavimo), rezervuodami juos sunkioms priežasčių užduotims, tokioms kaip nedviprasmiškumas, santrauka ir faktų patikrinimas. bandžiau parodyti vieną iš būdų, kaip suskirstymas atrodytų. Konkretus pavyzdys: įlankos žemės drebėjimas Leiskite mums paleisti tikrą straipsnį per mūsų vamzdyną. istorija: Title: 3,2 balo stiprumo žemės drebėjimas netoli Palangoje 3,2 balo stiprumo žemės drebėjimas netoli Palangoje CBS Bay Area, rugsėjo 7, 2025 Source: Snippet: „Sekmadienį ryte netoli Pleasantono įvyko 3,2 balo žemės drebėjimas, pranešė Jungtinių Valstijų geologijos tarnyba. Žemės drebėjimas įvyko vos po 10 valandos ryto, maždaug už 3 mylių į šiaurę nuo Pleasantono. Kiekvieno iš agentų pareigos apibendrinamos žemiau: Fetcher Agent: traukia straipsnio tekstą. Passage Extractor: pabrėžia žemės drebėjimo mastą, laiką, vietą ir drebėjimą. Entity Extractor: identifikuoja Pleasanton, USGS, East Bay. Entity Disambiguation: išsprendžia Pleasanton, CA, ir Jungtinių Amerikos Valstijų geologinės apklausos. Entity Tagger: klasifikuoja Pleasanton → Vieta; USGS → Organizacija. Temų klasifikatorius: tokie ženklai kaip stichinės nelaimės, vietinės naujienos, seismologija. Jausmas ir požiūris: neutralus, informacinis. Tag Summarizer: : “A 3.2-magnitude quake hit Pleasanton; residents felt weak shaking.” Local News : “USGS confirmed the quake’s magnitude; no damage reported.” Natural Disaster Fakto patikrinimas: patvirtina dydį per USGS ir sukasi ataskaitas per Patch. Personalizavimas ir reitingas: pabrėžia vietines naujienas (naudotojo profilį, svertinį į įlankos sritį). „Digest Compiler + Delivery“: siunčia el. laišką su tema „Your Bay Area Update – Earthquake Alert“. Tai, kas prasidėjo kaip žaliavinė antraštė, tapo struktūrizuotu, reitinguotu, faktiškai patikrintu skaitymu. Be naujienų: apibendrinimas su kitais pašarais Tai, kas galinga apie šį agento vamzdyną, yra tai, kad niekas jame nėra susietas tik su naujienomis. . framework for taking any content feed → extracting structure → producing a personalized digest Paimkime dar vieną pavyzdį: . arXiv papers Kiekvieną dieną šimtai mokslinių tyrimų straipsnių patenka į tokias kategorijas kaip mašininis mokymasis, kompiuterinė vizija ar kvantinis skaičiavimas.Tyrėjui iššūkis yra toks pat kaip naujienos: per daug tūrio, per mažai laiko ir tik keli straipsniai yra tikrai aktualūs. Kaip veikia tie patys agentai Fetcher Agent Įvadas: arXiv RSS srautas arba API užklausa. Metaduomenys: popieriaus metaduomenys (pavadinimas, autoriai, abstrakcija, kategorija) Passage Extractor Agent Įvadas: abstraktus tekstas Išvestis: raktiniai sakiniai (problemos pareiškimas, metodas, rezultatas). Named Entity Extractor Agent Įvadas į abstrakciją. Išvestis: tokie subjektai kaip „transformatorius“, „federalinis mokymasis“, „TPU v5e“. Entity Disambiguation Agent Įvadas: subjektai + kontekstas. Išvestis: nuorodos į kanoninius ID (pvz., arXiv teminius kodus, Vikipedijos įrašus). Entity Tagger Agent Įvadas: išspręsti subjektai Išvestis: Kategorijos: Algoritmas, duomenų rinkinys, aparatūra, domenas. Topic Classifier Agent Įvadas: abstraktūs įterpimai Išvestis: Žymos kaip {Gilusis mokymasis, stiprinimas mokymasis, paskirstytos sistemos}. Sentiment & Stance Agent Įvadas į abstrakciją. Išėjimas: „Teigiamas rezultatas“ (modelis įveikia SOTA 2%), „Kritinis“ (popierius paneigia ankstesnį reikalavimą). Tag Summarizer Agent Įvadas: subjektai + temos. Output: : “New optimizer reduces GPU communication overhead by 30%.” Distributed Training : “Transformer variant improves long-context understanding.” NLP Fact-Checker Agent Įvadas: teiginiai abstrakčiai. Išvestis: Pagrindinis patvirtinimas, palyginti su citatais, ankstesniais arXiv dokumentais. Personalization & Ranking Agent Įvadas: santraukos + naudotojo profilis. Išvestis: Svertinis sąrašas, pvz., ML (0.9), Sistemos (0.7), Teorija (0.2). Digest Compiler Agent Išvestis: Kasdieninis „Tyrimų skaitmenys“, suskirstyti pagal temas, kurias jums rūpi. Daily Digest Agent Output: Email / Slack message titled “Your Research Updates — Sept 7, 2025.” Pavyzdinis produktas Machine Learning „Naujasis optimizatorius paskirstytam mokymui sumažina GPU ryšio perteklių 30 proc.“ „Transformerio variantas pagerina ilgalaikio konteksto supratimą.“ Systems „Naujasis TPU darbo apkrovų tikrinimo metodas pagerina patikimumą.“ Theory „Paprastai popierius paneigia ankstesnes ribas dėl menko atkūrimo aukštos dimensijos nustatymuose.“ Bendrasis principas Nesvarbu, ar tai yra: Naujienų straipsniai (politika, finansai, Bay Area vietos atnaujinimai), Akademiniai straipsniai (arXiv, PubMed) vidinės įmonės ataskaitos (logai, metrikos skydeliai), Tą patį . agent pipeline applies Jūs visada darote: Išsaugokite turinį Ištraukite ištraukas. Identifikuokite subjektus, atskleiskite juos. Žymė ir klasifikacija. Apibendrinimas ir faktų tikrinimas. Ranking pagal naudotojo profilį. Pateikite kaip digestą. Tai yra The , ir agentai yra natūralus būdas jį įgyvendinti. feed-to-digest pattern MCP: protokolas, leidžiantis agentams kalbėti Kai kelių agentų grandinės kartu, atsiranda du dideli iššūkiai: — How does the Passage Extractor know how to hand results to the Entity Disambiguation Agent? Inter-agent communication — How do agents fetch data from APIs (like arXiv, USGS, or RSS feeds) without each agent reinventing its own protocol? External integrations Štai kur Įeina į MCP (Model Context Protocol) What is MCP? Pagalvokite apie MCP kaip apie . USB standard for AI agents Jis apibrėžia įrankių ir paslaugų sąsajas. Jis nurodo, kaip agentai perduoda kontekstą (įėjimus, išėjimus, metaduomenis). Tai leidžia sąveiką - tai reiškia, kad galite pakeisti vieną agentą kitam, nepažeidžiant vamzdyno. Su MCP, "Passage Extractor" nereikia "žinoti" "Entity Tagger" įgyvendinimo detalių. jis tiesiog siunčia struktūrizuotus duomenis (tekstą + įterpimus + žymes) formatu, kurį supranta MCP. Vidaus komunikacija Mūsų dujotiekio viduje: Fetcher Agent outputs in MCP format. {title, body, url, timestamp} Paslaugų siuntimas ir grąžinimas (paslaugų siuntimas). Pavadintas Entity Extractor sunaudoja {passages} ir gamina {entities}. Entity Disambiguation suvartoja {entities, context} ir gamina {entity_id}. Kiekvienas agentas kalba ta pačia „kalba“ dėka MCP. Išorės komunikacija MCP taip pat veikia išorėje. pvz.: Fetcher Agent naudoja MCP skambinti arXiv API arba RSS srautą. Faktų tikrinimo agentas naudoja MCP užklausoms apie Vikipediją ar naujienų bazę. "Daily Digest" agentas naudoja MCP, kad pateiktų rezultatus el. Paštu arba "Slack". Privalumas yra tas, kad agentai gali integruotis su tol, kol šis įrankis kalba MCP, kaip ir bet kokio USB įrenginio prijungimas prie savo nešiojamojo kompiuterio. any external tool Kodėl tai svarbu Be MCP, kiekvienam agentui reikėtų individualizuotų adapterių – šiurkštus vienkartinių integracijų netvarka. Standartizuotos sutartys → kiekvieno agento įvestis / išvestis yra nuspėjama. Plug-and-play architektūra → Jūs galite pakeisti jausmų agentą geresniu rytoj. Skaliuojamumas → dešimtys agentų gali koordinuoti be špagetų kodo. Kitaip tariant, MCP yra tai, kas paverčia scenarijų kolekciją į . modular, extensible agent platform Uždaromos mintys Kelionė nuo plokščio, raktinių žodžių pagrįsto šaltinio → į agentų naujienų kambarį → į apibendrintą virškinimo platformą atspindi, kaip vystosi programinė įranga: nuo scenarijų iki sistemų iki ekosistemų. Naujienos šiandien, arXiv rytoj, žurnalai ir skydai kitą dieną. Ir kai MCP suteikia klijus, šie agentai nustoja būti izoliuoti hakeriai ir pradeda dirbti kaip didesnės, sąveikios sistemos dalis. feed-to-digest, powered by agents. Negalima patekti į "agentinio AI" hype - parašykite geresnes priemones su stipriu pagrindu ir pasinaudokite LLM, kur jie prideda vertės: tobulinti, apibendrinti ir pakartoti. Kitame skyriuje aš pasinersiu į tai, kaip galite įgyvendinti daugiagento sistemas su MCP.