338 lecturas

El truco que nos hicieron los frameworks de gestión de agentes

por tyingshoelaces.com8m2024/11/15

Demasiado Largo; Para Leer

Los marcos de IA de Agentic son abstracciones poco fiables y fundamentalmente irreales. Para crear flujos complejos, encadenados y repetibles mediante LLM se necesitan conocimientos, habilidades y mucho trabajo.

featured image - El truco que nos hicieron los frameworks de gestión de agentes

El truco más grande que el Diablo jamás hizo fue convencer al mundo de que no existía...

Seguramente has escuchado la famosa frase: "El mayor truco que jamás hizo el Diablo fue convencer al mundo de que no existía".

Las referencias teológicas son relevantes aquí porque, más que cualquier avance tecnológico de los últimos tiempos, la manía que rodea a la IA Generativa es más religión que ciencia o ingeniería.

El objetivo de este blog no es luchar contra el tren de la propaganda (sugiero Gary Marcus ) en busca de un contrapeso. Este es un análisis crítico del aceite de serpiente que se vende al consumidor desprevenido. Tengo una tesis simple. Los marcos de IA de agentes son abstracciones poco confiables y fundamentalmente irreales. Construir flujos complejos, encadenados y repetibles utilizando LLM requiere conocimiento, habilidad y trabajo duro.

Es tentador buscar un atajo, una solución milagrosa, pero se puede subirse al tren de la publicidad hasta que se descarrilen o construir las bases para el largo recorrido.

¿Qué es Agentic AI?

Diferenciando entre el trigo y la paja

“La inteligencia artificial (IA) Agentic es un avance revolucionario en el campo de la inteligencia artificial. Es una combinación de diferentes técnicas, modelos y enfoques de IA que permite crear una nueva generación de agentes autónomos que pueden analizar datos, establecer objetivos y tomar medidas para alcanzarlos, todo ello con una mínima supervisión humana. La IA Agentic permite a estos agentes autónomos lograr una cognición casi humana en muchas áreas, lo que los convierte en máquinas de resolución de problemas que prosperan en entornos dinámicos y aprenden y mejoran constantemente con cada interacción.

¡Guau! ¡Increíble! ¡Alucinante!

También es una tontería absoluta... Déjame intentarlo,

La IA generativa es el uso de la IA generativa en flujos de trabajo complejos. Los resultados que generan los LLM pueden ser relevantes o no para la tarea asignada. La IA generativa hereda la sofisticación, la inteligencia y la confiabilidad de sus resultados de las instrucciones y la programación del sistema, la mayoría de las cuales son muy abstractas, escritas por principiantes y darán como resultado un sistema que apenas funciona.

La IA con agentes es excelente para hacer demostraciones para consumidores no sofisticados, pero generalmente no es buena para implementarla en ningún caso de uso en el que el resultado sea realmente importante. No funcionará en absoluto a menos que seas un experto, pero es casi seguro que no lo eres.

Permítanme ser claro: no soy escéptico en lo más mínimo sobre la inteligencia artificial de última generación. Creo que, si se utiliza de forma experta y con herramientas que aún no existen, podemos implementar flujos de trabajo que cambiarán la forma en que realizamos las tareas. Tal vez no en la medida de la que hablan los agoreros de la IA, pero definitivamente en la medida de un cambio de paradigma para muchas formas de trabajar.

No es casualidad que el primer caso de uso decisivo para la IA general sea la programación, porque la programación siempre será el primer dominio en obtener las herramientas y la infraestructura adecuadas. La razón es sencilla: creamos las herramientas y la infraestructura para las herramientas de programación con, ejem, programación. La programación es una preocupación de bajo nivel, un primer caso de uso perfecto. También es una habilidad que, por cierto, seguirá siendo una (si no "la") habilidad relevante y más codiciada durante días, semanas, meses, años y, probablemente, generaciones venideras.

Las herramientas de codificación han demostrado el potencial de Gen AI. Tengo dos herramientas LLM independientes que pago y uso a diario para codificar porque a menudo se bloquean debido a la demanda abrumadora y la infraestructura ecológica. Las uso simultáneamente en diferentes ventanas de IDE. Esto se debe a que son nuevas, por lo tanto lentas y, a veces, inestables.

Aun así, han revolucionado mi flujo de trabajo. Estoy teniendo un mal día cuando enciendo mi computadora y Claude está ocupado, así que estoy hablando con o1-mini. Y este es el comienzo de las formas cambiantes en que Gen AI cambiará la forma en que trabajas...

Estas herramientas se están construyendo desde cero; son completamente nuevas y aún no son confiables. Esto es emocionante porque es el comienzo. Estamos en medio de una nueva ola. Lo que me lleva al tema de este blog: la mentira y la extralimitación que representa la IA agente.

La mentira de la IA agente

Una simple abstracción de una API compleja y poco confiable.

Hace muchos años, dirigía una agencia de desarrollo y se nos unió un desarrollador recién graduado al equipo. Le asigné una tarea bastante sencilla (crear un formulario web en PHP). Lo revisaba periódicamente.

"¿Cómo está yendo?

“¡Muy bien!

Pasaron días y semanas, y el teclado seguía tecleando. Tardaba demasiado, así que me acerqué al programador y le pedí que me mostrara el código en el que habían estado trabajando. Era una capa anidada de bucles forEach que abarcaba miles de líneas de código.

Se me encogió el estómago (el cliente estaba esperando esto…) y me quedé sin palabras. Fue un golpe físico, todo encajó. ¿Fue culpa mía por no haberle proporcionado orientación? ¿El programador era una causa perdida? ¿Qué demonios le voy a decir al cliente que se supone que debe pagar por esto? (Facturamos tiempo, no resultados…)

La razón por la que me desvío del tema es que es exactamente la misma sensación que tengo cuando leo la documentación de cualquier marco de Agentic con el que me he topado. No soy el único.

No quiero centrarme en ningún marco específico (aún no he encontrado ningún marco de Python Agentic al que no pueda aplicar esto), pero cuando sus documentos comienzan a hablar sobre roles, trabajadores, jefes e historias de fondo, todo el concepto comienza a leerse como una novela de fantasía.

La razón es que todo ES una novela de fantasía. Es una herramienta revolucionaria y sofisticada, construida con tecnología pionera, que funciona de inmediato para principiantes. Y es tan enrevesada y contradictoria como eso suena.

No digo que los flujos de trabajo LLM complejos no puedan funcionar; digo que la experiencia requerida y el nivel de control de los matices son extremadamente altos, y la creación de marcos "simples y accesibles" es simplemente imposible hasta que las herramientas sean más maduras y las bases sean más sólidas.

En este momento, hay muy pocas personas en el mundo (¡aunque caminan entre nosotros!) con la experiencia para crear y mantener flujos de trabajo iterativos complejos y confiables (¡basados en Gen AI o no!) que funcionen y sean fieles a la definición de flujos de trabajo de Agentic que se venden mayoritariamente.

Pero lo que me molesta es que estos pioneros están trabajando en casos de uso de vanguardia que probablemente no conocemos. No están creando en público en Twitter, ni escribiendo blogs ni guías prácticas. No se centran en crear un marco que permita automatizar fácilmente las publicaciones en LinkedIn. Están trabajando en ello en silencio y a puerta cerrada.

Lo entiendo, realmente lo entiendo.

La gente quiere un marco de trabajo accesible y fácil de usar que les permita crear flujos de trabajo complejos y fiables con resultados empresariales reales. Yo quiero muchas cosas. El elixir de la vida. Crecer unos centímetros más. Convertirme en el campeón de tenis de mi club deportivo. Es más probable que me convierta en el campeón de tenis local alto y con eterna juventud que que cualquiera de estos marcos de trabajo agénticos funcione para el usuario medio y créanme a mí y a cualquiera que me haya visto jugar al tenis cuando digo que esto es extremadamente improbable.

Los frameworks de Agentic son el intento de crear un generador de sitios web WYSIWYG antes de que hayamos llegado a un acuerdo sobre un único estándar unificado para HTML. Son prematuros.

No se trata de poner el carro delante de los bueyes, sino de intentar construir un cohete antes de que hayamos descubierto la electricidad. Una apropiación oportunista de tierras que ya ha tenido éxito.

Capas de abstracciones

Una herramienta rota.

El problema de proporcionar una herramienta o un marco que te permita abstraer la funcionalidad es que viene con un conjunto de suposiciones. Cuando compro un martillo, supongo que funcionará. Cuando compro una hidrolimpiadora, supongo que funcionará.

El problema es que cuando utilizo un framework, doy por sentado que funcionará, pero esto es literalmente imposible dada la madurez de la tecnología subyacente. Lejos de aumentar la adopción, los frameworks Agentic venden una ilusión sobre demostraciones altamente controladas y casos de uso finitos que nunca funcionarán en manos del usuario típico (y hay millones...).

El daño que están causando es significativo. De la misma manera que hoy en día los desarrolladores aprenden React antes de aprender JavaScript, o adoptan marcos de trabajo antes de aprender los principios de programación, una generación de entusiastas tecnólogos se está subiendo al tren de la moda para aprender el marco de trabajo "x". La cuestión es la siguiente: no funcionará (según ningún estándar razonable); de hecho, crear una demostración o un prototipo es todo un logro en sí mismo.

Pero eso no significa que la inteligencia artificial general o los LLM "no" funcionen, aunque eso se convertirá en una suposición a corto plazo. Simplemente significa que no hemos alcanzado un nivel de madurez de la tecnología subyacente como para poder construir abstracciones sólidas sobre ella de manera segura. Hay demasiados problemas que resolver primero. Algunos problemas fundamentales que los proveedores de LLM deben resolver a un nivel profundo incluyen, entre otros:

Estado latente

Disponibilidad

Seguridad

Salida confiable

Escala

Así que sí, lo que estoy diciendo es que las API subyacentes a menudo se ven desbordadas por el uso; son lentas, vulnerables a la piratería (especialmente a la piratería rápida) e introducen cambios importantes todas las semanas. Los verdaderos innovadores están trabajando duro a puerta cerrada para solucionar estos problemas. Pero hasta que tengamos más avances, buena suerte en la creación de un sistema de producción fiable, y mucho menos de un marco de trabajo.

Si no comprende las API subyacentes (que, por cierto, son el verdadero avance valioso con el que todos estamos trabajando), ¿cómo es posible construir un sistema sobre ellas? Algunas API no requieren que comprendamos sus limitaciones, principalmente porque son una caja negra que simplemente funciona. Se necesitarán años, si no una generación, para que los LLM alcancen este nivel de madurez; hasta entonces, deberían venir con un cartel de advertencia que diga "Uso en producción solo para expertos".

Es imposible construir una abstracción fiable sobre arenas movedizas. De hecho, esto rompe el principio básico de la programación informática. La abstracción en informática es el proceso de eliminar elementos que distraen de elementos más importantes. No podemos centrarnos en los detalles de alto nivel cuando el sistema de bajo nivel no es fiable; necesitamos entender los matices y el uso dentro de un paradigma sofisticado. No un marco mágico de poco o nada de código (con abstracciones fantásticas).

Esto nos está llevando al abismo de la desilusión, lo que si bien no es en sí un problema ya que brinda espacio para construir cosas de verdadero valor, sigue siendo decepcionante de observar.

El truco más grande

Inventando la rueda en la era Jurásica.

El mayor truco que han utilizado los marcos de inteligencia artificial de Agentic es convencerte de que son necesarios. Son el demonio del panorama de LLM.

No necesitas tripulaciones, agentes, historias de fondo ni bonitas interfaces gráficas que te muestren cosas que nunca funcionarán.

Debes entender que los LLM son herramientas poderosas que debes entender sin historias de una novela de fantasía. Tus aplicaciones de demostración y de Hello World deben crearse a mano, en código. Cuando entiendas el cómo, el por qué y el qué, y puedas controlar las entradas y salidas de los modelos de Gen AI, entonces tendrás una base para salir al mundo y crear algo útil. Y probablemente llevará un tiempo.

No con magos, administradores, agentes y dragones, sino con los usos deterministas precisos de un gran avance en IA.

Publicado originalmente: https://tyingshoelaces.com/blog/agentic-framework-lie