Cada matí, milions de persones obren els seus telèfons a la mateixa cosa: una inundació de titulars. Política global, anuncis tecnològics, fluctuacions del mercat i històries locals competeixen per l'atenció. El que necessiteu són eines ben dissenyades amb fonaments forts: sistemes que poden recollir informació, processar-la, enriquir-la amb estructura i lliurar-la d'una manera que s'adapti al vostre context. Els agents Penseu en funcions senzilles que poden fer trucades RPC / API, recollir dades d'una font, processar-les i transmetre-les a un LLM o lliurar-les a altres agents per a més processament. En el context de grans models lingüístics, un agent normalment: Percepció mitjançant entrades com ara resultats de cerca, API o instruccions d'usuari. Raons amb l'ajuda d'un LLM, decidint què prioritzar. Actua trucant eines, executant codi o presentant resultats. Si alguna vegada heu preparat per a una entrevista de disseny del sistema, sabreu que el disseny del feed sempre apareix: el Feed de notícies de Facebook, la línia de temps de Twitter o (si sou un nen dels anys 90) lectors de RSS. Agent de notícies personalitzat Imagineu que expliqueu a l'agent que us interessa sobre certes etiquetes: Fa tres coses: AI, Apple i les històries de la zona de la badia Descarrega les principals notícies de la web. Filtreu els resultats per aquestes paraules clau. Els resumeix en un digestiu ràpid. En un dia determinat, pot donar-vos: Apple presenta un nou model d'IA en dispositius per a Siri i les aplicacions iOS. El projecte d'expansió del ferrocarril de la zona de la badia assegura finançament. Els mercats es refreden a mesura que la demanda de xips d'IA es desaccelera després de la pujada del trimestre passat. Això ja és útil. El firehose es redueix a una llista gestionable. Però és pla. No saps per què una història importa, o com es connecta amb els altres. Introducció de múltiples agents En lloc de dependre d'un agent monolític que fa tot de final a final, podem dividir el flux de treball entre Aquest és el mateix principi que una sala de premsa: els periodistes recullen la matèria primera, els investigadors l'anoten, els analistes proporcionen el context i els editors l'embalegen per als lectors. specialist agents En el nostre canal de notícies, això es veu així: Fetcher Agent: recupera els articles de notícies complets de les fonts d'informació o API. Passage Extractor Agent - destaca les seccions més rellevants de cada article. Agent d'extractor d'entitat anomenat - treu les persones, empreses, llocs i productes esmentats. Agent de desambiguació d'entitats: assegura que "Apple" és Apple Inc., no el fruit. Agent d'etiquetes d'entitat: assigna etiquetes estructurades (per exemple, Organització: Apple, Producte: iPhone). Agent de classificació de temes: identifica temes més amplis com ara AI, finances, àrea de la badia. Sentiment & Stance Agent: determina si la cobertura és positiva, negativa o neutral. Tag Summarizer Agent: fusiona entitats, temes i sentiments en seccions temàtiques. Fact-Checker Agent - valida les reclamacions contra fonts de confiança. Agent de personalització i classificació: prioritza les històries que coincideixin amb els teus interessos i la història. Digest Compiler Agent: assembla el digest polit en un format amigable per al lector. Daily Digest Agent - lliura el paquet final (a la vostra bústia de correu, Slack o aplicació). Alguns d’aquests agents treballen (per exemple, la desambiguació ha de seguir l'extracció), mentre que altres poden executar (la classificació de temes, l'anàlisi de sentiments i l'extracció d'entitats poden treballar en el mateix passatge a la vegada).El resultat és una canonada coordinada d'especialistes, produint una digestió molt més rica i més estructurada que qualsevol agent únic podria. sequentially in parallel Què entra i què surt - Interfícies d'agent La taula següent resumeix el que cada agent esperaria i el que donaria de nou. També vaig tractar de mostrar on els agents podrien interactuar amb LLMs si necessiten ajuda. Agent Inputs Outputs LLM Needed? Fetcher News feed URL, RSS, API query Full article text, metadata (title, URL, timestamp, source) ❌ No — HTTP/API call Passage Extractor Full article text Key passages, passage embeddings ✅ Optional — LLM for salience, or embeddings/TF-IDF Named Entity Extractor Passages Entity list, spans, embeddings ❌/✅ — NER models are faster, LLM can catch novel entities Entity Disambiguation Entity list, context embeddings Resolved entities with canonical IDs (e.g., Wikidata Q312) ✅ Yes — reasoning helps resolve ambiguous names Entity Tagger Disambiguated entities Entities with categories (Org, Person, Product, Location) ❌ No — deterministic classification Topic Classifier Passages, embeddings Topic labels (AI, Finance, Bay Area) ❌/✅ — embeddings + clustering or LLM for nuance Sentiment & Stance Analyzer Passages, entities Sentiment score, stance (supportive/critical/neutral) ✅ Optional — LLM for nuance, or sentiment models for speed Tag Summarizer Tagged entities, topics, sentiment Structured summaries grouped by tag ✅ Yes — summarization requires LLM Fact-Checker Summaries, claims Verified/Unverified claims, supporting references ✅ Yes — requires claim extraction + retrieval reasoning Personalization & Ranking Validated summaries, user profile Ranked/weighted story list ❌ No — ML heuristics suffice Digest Compiler Ranked summaries Final formatted digest (Markdown, HTML, JSON) ❌/✅ — deterministic formatting, LLM optional for tone Daily Digest Compiled digest Delivery package (email, Slack, app notification) ❌ No — just delivery Fetcher Feed de notícies URL, RSS, consulta d'API Text complet de l'article, metadades (títol, URL, timestamp, font) No - trucada HTTP / API Passage Extractor Text complet de l'article Passatges clau, passatges embeddings ✅ Opcional — LLM per a saliència, o embeddings / TF-IDF Named Entity Extractor Passatges Llista d'entitats, espais, embeddings Els models NER són més ràpids, LLM pot atrapar noves entitats Entity Disambiguation Llista d'entitats, embeddings de context Entitats resoltes amb identificadors canònics (per exemple, Wikidata Q312) Sí - el raonament ajuda a resoldre els noms ambigus Entity Tagger Entitats ambigües Entitats amb categories (Org, Persona, Producte, Lloc) No - Classificació determinista Topic Classifier Passatges, embeddings Etiquetes de temes (AI, Finances, Àrea de la Badia) /✅ — embeddings + clustering o LLM per a matisos Sentiment & Stance Analyzer Passos, Entitats Sentiment puntuació, postura (suport / crític / neutral) ✅ Opcional - LLM per a matisos, o models de sentiment per a la velocitat Tag Summarizer Entitats, temes i sentiments Resums estructurats agrupats per tag ✅ Sí - la síntesi requereix LLM Fact-Checker Resum, reivindicacions Afirmacions verificades / no verificades, referències de suport ✅ Sí - requereix extracció de reclamacions + raonament de recuperació Personalization & Ranking Resums validats, perfil d'usuari Llista d'històries classificades / pesades No - ML heurística suficient Digest Compiler Rànquings resumits Digest formatat final (Markdown, HTML, JSON) /✅ — Formatació determinista, LLM opcional per a el to Daily Digest Dibuixos de Digest Paquet de lliurament (email, Slack, notificació d’aplicació) No - només lliurament Alguns agents requereixen raonament LLM, altres són lleugers i deterministes. Aquesta divisió té importància: per a la producció, voldràs tan poques trucades LLM com sigui possible (per estalviar costos i latència), reservant-les per a tasques pesades en raonament com la desambiguació, la resumidació i la comprovació de fets. Un exemple concret: Terratrèmol de la zona de la badia Anem a executar un article real a través de la nostra canonada. Title: Un terratrèmol de magnitud 3,2 atempta a prop de Pleasanton Un terratrèmol de magnitud 3,2 atempta a prop de Pleasanton CBS Bay Area, 7 de setembre de 2025 Source: Snippet: "Un terratrèmol de magnitud 3,2 va colpejar a prop de Pleasanton diumenge al matí, segons l'Enquesta Geològica dels Estats Units. El terratrèmol va colpejar just després de les 10 del matí, a uns 3 milles al nord de Pleasanton. Les responsabilitats de cadascun dels agents es resumeixen a continuació: Fetcher Agent: puja el text de l'article. Extractor de pas: destaca la magnitud del terratrèmol, el moment, la ubicació i el tremolor. Extractor d'entitat: identifica Pleasanton, USGS, East Bay. Entity Disambiguation: resol a Pleasanton, CA, i l'Enquesta Geològica dels Estats Units. Etiquetatge d'entitat: classifica Pleasanton → Ubicació; USGS → Organització. Classificació de temes: etiquetes de desastres naturals, notícies locals, sismologia. Sentiment i actitud: neutral i informatiu. Tag Summarizer: : “A 3.2-magnitude quake hit Pleasanton; residents felt weak shaking.” Local News : “USGS confirmed the quake’s magnitude; no damage reported.” Natural Disaster Fact-Checker: confirma la magnitud a través de l'USGS i els informes de sacseig a través de Patch. Personalització i classificació: posa l'accent en Notícies Locals (perfil d'usuari pesat a l'Àrea de la Badia). Digest Compiler + Delivery: envia un correu electrònic amb el tema "La vostra actualització de la zona de la badia - alerta de terratrèmol". El que va començar com un títol cru es va convertir en un digest estructurat, classificat i verificat. Més enllà de les notícies: generalitzar a altres aliments El poderós d'aquesta canonada d'agents és que res en ella està lligat només a les notícies. . framework for taking any content feed → extracting structure → producing a personalized digest Prenem un altre exemple: . arXiv papers Cada dia, centenars d'articles de recerca cauen per categories com l'aprenentatge automàtic, la visió informàtica o la computació quàntica.Per a un investigador, el repte és el mateix que les notícies: massa volum, massa poc temps, i només uns pocs papers són realment rellevants. Com actuen els mateixos agents Fetcher Agent Introducció: arXiv RSS feed o API query. Resultats: metadades de paper (títol, autors, abstracte, categoria). Passage Extractor Agent Introducció: Text abstracte Sortida: frases clau (declaració de problema, mètode, resultat). Named Entity Extractor Agent Entrada següent: Abstracte Entitats com “transformador”, “aprenentatge federat”, “TPU v5e”. Entity Disambiguation Agent Introducció: Entitats + context. Sortida: Enllaços a ID canònics (per exemple, codis de tema arXiv, entrades de Wikipedia). Entity Tagger Agent Input: Entitats resoltes. Sortida: Categories: Algoritme, conjunt de dades, maquinari, domini. Topic Classifier Agent Introducció: Abstract embeddings Sortida: Etiquetes com {Aprenentatge profund, Aprenentatge reforçat, Sistemes distribuïts}. Sentiment & Stance Agent Entrada següent: Abstracte Sortida: “Resultat positiu” (el model supera el SOTA en un 2%), “Critical” (el paper refuta la reclamació prèvia). Tag Summarizer Agent Introducció: Entitats + temes. Output: : “New optimizer reduces GPU communication overhead by 30%.” Distributed Training : “Transformer variant improves long-context understanding.” NLP Fact-Checker Agent Introducció: Reclamacions en abstracte. Sortida: validació bàsica contra els criteris de referència citats, documents arXiv anteriors. Personalization & Ranking Agent Introducció: Resum + perfil d'usuari. Sortida: Llista ponderada — per exemple, ML (0.9), Sistemes (0.7), Teoria (0.2). Digest Compiler Agent Sortida: Un “Research Digest” diari agrupat per temes que t’interessen. Daily Digest Agent Sortida: Missatge de correu electrònic / Slack titulat "Les teves actualitzacions de recerca - 7 de setembre de 2025". Exemple de producció Machine Learning “A new optimizer for distributed training reduces GPU communication overhead by 30%.” “La variant transformadora millora la comprensió del context a llarg termini”. Systems "El nou enfocament de verificació per a les càrregues de treball de TPU millora la fiabilitat." Theory "El paper refuta els límits anteriors sobre la recuperació escassa en els entorns d'alta dimensió." El principi general Sigui que sigui: Articles de notícies (política, finances, actualitzacions locals de la zona de la badia), Documentació acadèmica (arXiv, PubMed) Informes interns de l’empresa (logs, taulells mètrics), El mateix . agent pipeline applies Sempre estàs fent: Fetch de contingut. Extracció de passatges. Identificar les entitats, desambiguar-les. Títol i classificació. Resum i comprovació de fets. Classificació basada en el perfil d'usuari. Entrega com a digestiu. Això és el , i els agents són una manera natural d'implementar-la. feed-to-digest pattern MCP: el protocol que permet als agents parlar Quan encadenem múltiples agents junts, apareixen dos grans reptes: — How does the Passage Extractor know how to hand results to the Entity Disambiguation Agent? Inter-agent communication — How do agents fetch data from APIs (like arXiv, USGS, or RSS feeds) without each agent reinventing its own protocol? External integrations Aquí és on Vine a entrar MCP (Model Context Protocol) Què és el MCP? Penseu en el MCP com el . USB standard for AI agents Defineix interfícies per a eines i serveis. Especifica com els agents passen el context (inputs, sortides, metadades). Permet la interoperabilitat, el que significa que es pot intercanviar un agent per un altre sense trencar la canonada. Amb MCP, el Passage Extractor no necessita "conèixer" els detalls d'implementació de l'Entity Tagger. Només envia dades estructurades (text + embeddings + tags) en un format que MCP entén. Comunicació interna Dins de la nostra xarxa: Fetcher Agent emet {title, body, url, timestamp} en format MCP. Passatge Extractor pren {body} i retorna {passatges, embeddings}. L'extractor d'entitat anomenat consumeix {passatges} i produeix {entitats}. La desambiguació entitat consumeix {entitats, context} i produeix {entitat_id}. Tots els agents parlen el mateix “idioma” gràcies a MCP. Comunicació externa MCP també funciona a l'exterior. Per exemple: L'agent Fetcher utilitza MCP per cridar una API arXiv o un flux RSS. The uses MCP to query Wikipedia or a news database. Fact-Checker Agent El Daily Digest Agent utilitza MCP per lliurar resultats a través de correu electrònic o Slack. L'avantatge és que els agents poden integrar-se Mentre aquesta eina parla MCP, és com connectar qualsevol dispositiu USB al seu ordinador portàtil. any external tool Per què això importa Sense MCP, cada agent necessitaria adaptadors personalitzats, una xocolata d'integracions úniques. Contractes estandarditzats → la entrada / sortida de cada agent és predictible. Arquitectura Plug-and-Play → pot substituir l'Agent Sentiment per un millor demà. Escalabilitat → desenes d’agents poden coordinar-se sense codi d’espagueti. En altres paraules, MCP és el que converteix una col·lecció de scripts en una . modular, extensible agent platform Tancament de pensaments El viatge d’un flux pla, basat en paraules clau → a una sala de notícies d’agents → a una plataforma de digestió generalitzada reflecteix com evoluciona el programari: dels scripts als sistemes als ecosistemes. Notícies d'avui, arXiv demà, diaris i taulells l'endemà. I amb el MCP que proporciona l'adhesiu, aquests agents deixen de ser pirates aïllats i comencen a treballar com a part d'un sistema més gran i interoperable. feed-to-digest, powered by agents. No et deixis atrapar per l'hype de "IA agent" - escriure millors eines amb fonaments forts, i aprofitar LLMs on afegeixen valor: per refinar, resumir i iterar. En la següent part, exploraré com es poden implementar els sistemes multiagent amb MCP.