Escoitaches a famosa cita: "O truco máis grande que fixo o diaño foi convencer ao mundo de que non existía".
As referencias teolóxicas son relevantes aquí porque máis que calquera avance tecnolóxico dos últimos tempos, a manía que rodea a IA xerativa é máis relixión que ciencia ou enxeñería.
O propósito deste blog non é loitar contra o tren de bombo (suxiro a Gary Marcus ) por un contrapeso. Esta é unha análise crítica do aceite de serpe que se vende ao consumidor desprevenido. Teño unha tese sinxela. Os marcos de IA axente son abstraccións pouco fiables e fundamentalmente irreais. Para crear fluxos complexos, encadeados e repetibles usando LLMs require coñecemento, habilidade e traballo duro.
É tentador buscar un atallo, unha bala de prata; pero podes montar o tren publicitario ata que se desprendan as vías ou construír as bases para o longo percorrido.
Diferenciar entre trigo e palla
"A IA axente é un avance revolucionario na intelixencia artificial. Unha combinación de diferentes técnicas, modelos e enfoques de intelixencia artificial, permite unha nova variedade de axentes autónomos que poden analizar datos, establecer obxectivos e tomar medidas para alcanzalos, todo cunha supervisión humana mínima. A IA axente permite que estes axentes autónomos logren unha cognición case humana en moitas áreas, converténdoas en máquinas de resolución de problemas que prosperan en ambientes dinámicos e aprenden e melloran constantemente con cada interacción.
Vaia. Incrible. Alucinante.
Unha tontería absoluta tamén... Déixame probar,
A IA axente é o uso da IA xerativa en fluxos de traballo complexos. Os resultados que producen os LLM poden ser ou non relevantes para a tarefa asignada. A IA axente herda a sofisticación, a intelixencia e a fiabilidade da súa saída das instrucións e da programación do sistema, a maioría dos cales son moi abstraídos, escritos por novatos, e dará lugar a un sistema que apenas funciona.
A IA axente é excelente para facer demostracións para consumidores pouco sofisticados, pero xeralmente é mala para implementar en calquera caso de uso onde o resultado sexa realmente importante. Non funcionará en absoluto a menos que sexas un experto, pero case seguro que non o sexas.
Permítanme ser claro, non son o máis mínimo escéptico sobre Gen AI, creo que se usa de forma experta e con ferramentas que aínda non existen, podemos implementar fluxos de traballo que cambiarán a forma en que realizamos as tarefas. Quizais non na medida en que falan os condenadores da IA, pero definitivamente ata o punto dun cambio de paradigma para moitas formas de traballar.
Non é casual que o primeiro caso de uso asasino para Gen AI sexa a programación porque a programación sempre será o primeiro dominio en obter ferramentas e infraestruturas adecuadas. A razón para isto é sinxela. Construímos a ferramenta e a infraestrutura para ferramentas de programación con, errrm, programación. A programación é unha preocupación de baixo nivel, un primeiro caso de uso perfecto. Tamén é unha habilidade que, por certo, seguirá sendo unha (se non "a") relevante e máis cobizada durante días, semanas, meses, anos e probablemente as xeracións vindeiras.
As ferramentas de codificación demostraron o potencial da Gen AI. Teño dúas ferramentas de LLM separadas que (pago e) uso diariamente para codificar porque adoitan quedar bloqueadas pola demanda abrumadora e unha infraestrutura verde. Eu úsoos simultaneamente en diferentes fiestras de IDE. Isto débese a que son novos, polo tanto lentos e ás veces escamosos.
Aínda así, revolucionaron o meu fluxo de traballo. Estou pasando un mal día cando arranco o ordenador e Claude está ocupado, así que estou falando con o1-mini. E este é o comezo das formas cambiantes en que Gen AI cambiará a túa forma de traballar...
Estas ferramentas estanse construíndo desde cero; son novos e aínda non fiables. Isto é emocionante porque é o comezo. Estamos no medio dunha nova onda. O que me leva ao tema deste blog. A mentira e o alcance que é Agentic AI.
Unha simple abstracción dunha API complexa e pouco fiable.
Hai moitos anos, dirixía unha axencia de desenvolvemento e tiñamos un programador recén titulado unirse ao equipo. Fixenlles unha tarefa razoablemente sinxela (construír un formulario web en PHP). Faría check-in regularmente.
“Como vai?
"Moi ben!
Pasaron os días e as semanas, e toque toque toque foi o teclado. Estaba tardando demasiado, así que fun ao programador e pedinlle que me mostrara o código no que estiveran traballando. Era unha capa aniñada de bucles forEach, chegando a miles de liñas de código.
O meu estómago afundiuse (o cliente estaba esperando isto...), e perdínme as palabras. Foi un golpe físico, todo fixo clic. Foi culpa miña por non dar orientación? O programador foi unha causa perdida? Que diaños lle vou dicir ao cliente que se supón que debe pagar por isto? (Facturamos o tempo, non os resultados...)
A razón pola que me divago é porque é exactamente a mesma sensación que teño cando leo os documentos de calquera Agentic Framework que atopei. Non estou só.
Non quero escoller ningún marco específico (aínda non atopei ningún marco axente de Python ao que non poida aplicar isto), pero cando os teus documentos comezan a falar de roles e traballadores, xefes e historias de fondo, todo o concepto comeza para ler como unha novela de fantasía.
O motivo é que todo é unha novela de fantasía. É unha ferramenta revolucionaria e sofisticada construída con tecnoloxía pioneira, que funciona fóra da caixa, para principiantes. E tan enrevesado e contradicido como parece.
Non digo que os fluxos de traballo complexos de LLM non poidan funcionar; Estou dicindo que a experiencia necesaria e o nivel de control dos matices son extremadamente altos, e que a creación de marcos "simples e accesibles" é simplemente imposible ata que as ferramentas estean máis maduras e as bases sexan máis sólidas.
Hai moi poucas persoas no mundo neste momento (aínda que andan entre nós!) Coa experiencia para crear e manter fluxos de traballo iterativos fiables e complexos (baseados na IA de xeración ou non!) que funcionen e sexan fieis á definición de Agentic. fluxos de traballo que se venden a maioría.
Pero aquí está o que me molesta; estes poucos pioneiros están a traballar en casos de uso de vangarda dos que probablemente non coñecemos. Non están construíndo en público en Twitter, nin escribindo blogs e guías prácticas. Non se centran en crear un marco para que poidas automatizar facilmente as túas publicacións en LinkedIn. Están levando as cousas en silencio e a porta pechada.
Enténdoo, de verdade.
A xente quere un marco accesible e fácil de usar que lles permita crear fluxos de traballo fiables e complexos con resultados comerciais reais. Quero moitas cousas. Elixir da vida. Crecer uns centímetros máis alto. Convértete no campión de tenis do meu club deportivo. É máis probable que me converta no alto campión local de tenis con eterna xuventude que para que calquera destes marcos axentes funcione para o usuario medio e créame a min e a calquera que me vise xogar ao tenis cando digo que isto é moi improbable.
Os frameworks axentes son o intento de construír un creador de sitios web WYSIWYG antes de que acordemos un único estándar unificado para HTML. Son prematuros.
Este non é un caso do carro antes do cabalo; isto está a tentar construír un foguete antes de que descubrimos a electricidade. Unha apropiación oportunista de terras que xa conseguiu.
Unha ferramenta rota.
O problema de proporcionar unha ferramenta ou marco que lle permita abstraer a funcionalidade é que inclúe un conxunto de presupostos. Cando merco un martelo, supoño que funcionará. Cando compro unha limpiadora a presión, supoño que funcionará.
O problema é que cando uso un framework, supoño que funcionará. Pero isto é literalmente imposible dada a madurez da tecnoloxía subxacente. Lonxe de aumentar a adopción, Agentic Frameworks vende unha ilusión ademais de demostracións altamente controladas e casos de uso finitos que nunca funcionarán en mans do usuario típico (e hai millóns...).
Os danos que están causando son importantes. Por moito que os desenvolvedores aprenden hoxe a React antes de aprender javascript, ou adoptan marcos antes de aprender os principios de programación. Unha xeración de tecnólogos entusiastas está subindo ao tren de bombo para aprender o marco "x". Aquí está a cousa; non funcionará (con ningún estándar razoable), de feito, construír unha demostración ou un prototipo é todo un logro en si mesmo.
Pero iso non significa que Gen AI ou LLM "non" funcionen, aínda que iso se converterá no suposto a curto prazo. Simplemente significa que non alcanzamos un nivel de madurez da tecnoloxía subxacente para poder construír con seguridade abstraccións sólidas sobre ela. Hai demasiados problemas para resolver primeiro. Algunhas cuestións fundamentais que deben ser resoltas a un nivel profundo polos provedores de LLM inclúen, pero non se limitan a:
Latencia
Dispoñibilidade
Seguridade
Saída fiable
Escala
Entón, si, o que estou dicindo é que as API subxacentes adoitan estar desbordadas polo uso; son lentos, vulnerables á piratería (especialmente á piratería rápida) e introducen cambios de ruptura semanalmente. Os verdadeiros innovadores están a traballar duro a porta pechada nestes problemas. Pero ata que teñamos máis avances, moita sorte construíndo un sistema de produción fiable e moito menos un marco.
Se non entendes as API subxacentes (que, por certo, é o verdadeiro avance valioso co que todos estamos a traballar), como podes construír un sistema encima? Algunhas API non esixen que entendamos as súas limitacións principalmente porque son unha caixa negra que funciona. Pasarán anos, se non unha xeración, para que os LLM alcancen este nivel de madurez, ata entón debería vir cun sinal de advertencia "Uso de produción só para expertos".
É imposible construír unha abstracción fiable encima de areas movedizas. De feito, isto rompe o principio básico da programación informática. A abstracción en informática é o proceso de eliminar elementos que distraen dos elementos máis importantes. Non podemos centrarnos en detalles de alto nivel cando o sistema de baixo nivel non é fiable; necesitamos comprender o matices e o uso dentro dun paradigma sofisticado. Non é un marco máxico baixo/sen código (con abstraccións fantásticas).
Isto está a conducirnos ao canal da desilusión, que aínda que non é un problema en si mesmo xa que ofrece espazo para construír cousas de verdadeiro valor, aínda é decepcionante de observar.
Inventando a roda na era xurásica.
O maior truco que conseguiron os frameworks de IA de Agentic é convencerte de que son necesarios. Son o demo da paisaxe LLM.
Non necesitas equipos, axentes, historias de fondo e interfaces gráficas bonitas que che mostren cousas que nunca funcionarán.
Debes entender que os LLM son ferramentas poderosas que deberías entender sen historias dunha novela de fantasía. As túas aplicacións de demostración e Hello World deberían crearse a man, en código. Cando entendas o como, o por que e o que e podes controlar as entradas e saídas dos modelos Gen AI, terás unha base para saír ao mundo e construír algo útil. E probablemente levará un tempo.
Non con magos e xestores e axentes e dragóns, senón cos usos deterministas precisos dun avance na IA.
Publicado orixinalmente: https://tyingshoelaces.com/blog/agentic-framework-lie