Los modelos de idiomas grandes son una parte central de los productos digitales modernos. En la parte superior de esta ola están las empresas que han quemado a través de más de un billón de tokens OpenAI. La tabla, extrapolada de un día de demostración reciente de OpenAI y, por lo tanto, comenzó a circular en X/Twitter, lista a 30 clientes que consumieron colectivamente una enorme cantidad de llamadas de API de IA. A continuación se muestra una mirada más profunda a lo que cada empresa hace, cómo desplegan la IA generativa, y una breve mirada a por qué y cómo su uso de tokens puede ser tan alto. La lista está ordenada alfabéticamente por empresa, mientras que la tendencia de imagen anterior fue ordenada alfabéticamente por el último nombre del representante de la empresa. Abrigo Abridge es una compañía de inteligencia artificial ambientada enfocada en la documentación de atención médica. Registra las conversaciones médico-paciente y las resume en notas clínicas estructuradas (notas SOAP) utilizando procesamiento de lenguaje natural avanzado y modelos de aprendizaje automático, generando resúmenes en tiempo real, artículos de acción y términos médicos clave. Con miles de clínicos que utilizan Abridge para transcribir y resumir consultas largas, el número de tokens se escala rápidamente. . Información sobre Abridge AI Canónico Canva es una plataforma de comunicación visual con 175 millones de usuarios mensuales.Un estudio de caso de OpenAI describe cómo el Magic Studio de Canva utiliza GPT-4 para la generación de contenido multimodal, permitiendo funciones como Magic Write (generación de texto), Magic Design (crear presentaciones y vídeos), Magic Switch (traducir y adaptar contenido), y más. . Estudio de caso Canva Cognición Cognition AI es la startup detrás de Devin, billetada como el primer ingeniero de software de IA del mundo. Devin, impulsado por el modelo de fundación GPT-4 de OpenAI, puede abordar de forma autónoma tareas de ingeniería complejas como escribir código, debugar y implementar aplicaciones. Ejecutar loopes de agentes para planificar, codificar y probar software requiere largas ventanas de contexto y repetidos pasos de razonamiento, impulsando el uso de tokens. . Análisis de VoiceFlow Codirigido CodeRabbit proporciona revisión automática de código y servicios de garantía de calidad. utiliza los modelos de OpenAI para analizar las diferencias, razonar sobre la estructura del programa y proponer correcciones; la revisión continua de código en miles de repositorios conduce a un número de tokens extremadamente grande. Para más . Página de Productos de CodeRabbit Datado Datadog es una plataforma de observación utilizada por los desarrolladores y los equipos de operaciones. En su conferencia 2023 Dash, la compañía introdujo Bits AI, un asistente digital construido sobre el ChatGPT de OpenAI que hace recomendaciones en tiempo real para temas como alertas y anomalías, y lanzó un producto llamado LLM Observability para monitorear LLMs personalizados. Debido a que Bits AI está integrado en dashboards que monitorean miles de servicios y registros, y porque LLM Observability analiza prompts y respuestas, el número de token es inmenso. . DevOps.com Decagón Decagon proporciona soporte de cliente totalmente automatizado. utiliza GPT-3.5, GPT-4, y GPT-4o para alimentar a los bots de agentes que manejan millones de conversaciones de clientes en empresas como Duolingo, Notion y Substack. Estos bots manejan todo el ciclo de vida del soporte - respondiendo a preguntas, resolviendo problemas y escalando cuando sea necesario - causando que el número de tokens aumente. . La historia de la decadencia Delphi Delphi construye chatbots personalizados “Digital Minds” para creadores e influencers. Su tubería de generación aumentada (RAG) absorbe podcasts, PDFs y redes sociales para entrenar a estos chatbots y utiliza una base de datos vectorial gestionada para almacenar más de 100 millones de embeddings. . Este informe sobre la escalación de Delphi con RAG Duolingo Duolingo es la aplicación de aprendizaje de idiomas más grande del mundo, conocida por sus lecciones gamificadas y su amplia distribución. Se ha asociado con OpenAI para integrar GPT-4 en Duolingo Max, que ofrece características como “Explain My Answer” y Role Play, lo que permite a los aprendices tener conversaciones con un barista virtual o guía turístico y recibir comentarios detallados. . Este artículo trata sobre las características de Duolingo Genspark AI Genspark AI (también conocido como Sparks) es una startup de IA china fundada por los ex ejecutivos de Baidu Eric Jing y Kay Zhu. La compañía emplea una arquitectura Mixture-of-Agents que orquesta más de 80 herramientas del mundo real para realizar tareas de usuarios, ha recaudado 160 millones de dólares y ha atraído a más de dos millones de usuarios. . Introducción a Genspark Harvey Harvey construye herramientas generativas de IA seguras para el derecho, los impuestos y las finanzas. Harvey se asoció con OpenAI para desarrollar un modelo de jurisprudencia personalizado; la plataforma puede redactar documentos, responder preguntas sobre escenarios de litigio e identificar discrepancias en contratos. Con las grandes firmas de abogados generando y revisando miles de documentos largos, los volúmenes de tokens son enormes. . La historia de Harvey Siguiente HubSpot/Dashworks HubSpot adquirió Dashworks, un asistente de búsqueda de trabajo alimentado por IA. Dashworks conecta datos a través de aplicaciones, realiza búsquedas profundas y resume detalles importantes. Su equipo ayudará a construir asistentes de IA para cada trabajador que va al mercado. La capacidad de Dashworks de ingerir y razonar sobre bases de conocimiento corporativas utiliza grandes ventanas de contexto; integrar esto en el Breeze Copilot de HubSpot multiplica el uso de token en miles de clientes. . Anuncio de HubSpot Soluciones iSolutionsAI construye modelos de aprendizaje automático personalizados y chatbots de IA para empresas. La integración de modelos de OpenAI en el flujo de trabajo de cada cliente resulta en muchas ventanas de contexto largas (preguntas de clientes, historias de CRM, etc.), lo que explica el alto volumen de tokens. . La página de servicios de iSolutionsAI verdaderamente De hecho, opera el mayor mercado de trabajo del mundo. Su equipo de ingeniería ha utilizado durante mucho tiempo algoritmos de aprendizaje automático para coincidir con los demandantes de empleo y los empleadores, y en los últimos años ha añadido modelos de IA generativos para mejorar estas recomendaciones. . La entrevista del CIO JetBrains JetBrains hace populares herramientas de desarrollador como IntelliJ y PyCharm. Su asistente de IA está alimentado por la API de OpenAI, que la compañía integró debido a su razonamiento avanzado y facilidad de uso. El asistente ayuda a millones de desarrolladores a generar pruebas, código refactor, escribir mensajes de comisión y aclarar errores. Dada la escala de su base de usuarios, incluso las sugerencias de código simples se traducen en enormes cantidades de token. . JetBrains’ Asistente de AI FAQ Mercado Libre Mercado Libre es la mayor empresa de comercio electrónico y fintech de América Latina.La compañía construyó Verdi, una plataforma de desarrollo de IA que aprovecha GPT-4o y otros modelos para manejar tareas complejas como la mediación del servicio al cliente, la detección de fraudes, la localización y las revisiones de resumen.Verdi ya resuelve el 10% de los casos de mediación y está en camino para mediar 450 millones de dólares en disputas anualmente. . Vista general de Verdi noción Notion es un espacio de trabajo conectado para la escritura, la planificación y la gestión del conocimiento. transformó su producto en una plataforma profundamente alimentada por la IA mediante la integración de modelos OpenAI para resumir páginas, generar escritura y responder a preguntas en todo el espacio de trabajo. La combinación de una enorme base de usuarios y características generativas como Notion AI lleva a una enorme huella de token. . La historia de la apertura OpenRouter OpenRouter ejecuta una API de estilo mercado que permite a los desarrolladores acceder a cientos de grandes modelos de idiomas a través de un único punto final. La plataforma soporta los modelos OpenAI, Anthropic, Google, Meta y Mistral y maneja automáticamente el fallback y el enrutamiento rentable. Debido a que cada solicitud realizada por miles de aplicaciones de clientes es proxionada a través de OpenRouter, el número acumulativo de tokens de la compañía se acumula rápidamente. . Vista general de OpenRouter extracción Outtake ofrece automatización de ciberseguridad impulsada por la IA. Su plataforma de agentes detecta y remedia ataques en horas, automatizando tanto la detección como la respuesta. Las cargas de trabajo de ciberseguridad requieren analizar extensos registros y flujos de telemetría; utilizando modelos de OpenAI para triar, explicar alertas y generar scripts de reparación consume miles de millones de tokens. . La historia de la ciberseguridad Outtake Perplejidad Perplexity AI es un motor de búsqueda impulsado por la IA que responde a preguntas con fuentes citadas. La suscripción de Perplexity Pro incluye modelos avanzados de OpenAI, como los modelos GPT-5 y de la serie o de OpenAI, junto con los modelos antropológicos y de código abierto. Cuando los usuarios realizan búsquedas profesionales, el sistema puede llamar a modelos de OpenAI para razonamiento profundo y búsqueda web. . El artículo Perplexity Pro ayuda Rampas Ramp es una compañía de fintech que automatiza los gastos corporativos. Sus agentes de IA automatizan los informes de gastos, la adquisición y la contabilidad. Estos agentes, construidos sobre los modelos de OpenAI, deben analizar e interpretar recibos, correos electrónicos y facturas a escala; cada documento aporta tokens, y el volumen agregado de miles de clientes supera rápidamente un billón. . Informe de PYMNTS Lea el Read AI crea herramientas de productividad de reuniones que resumen automáticamente las conversaciones, los correos electrónicos y los chats. Escucha a las llamadas de Zoom o Google Meet y resume rápidamente las conversaciones, proporcionando transcripciones, coaching y condensando mensajes a través de los enlaces de correo electrónico. . Artículo de Siliconangle Rox Rox está construyendo una plataforma de operaciones de ingresos impulsada por la IA. Unifica los datos fragmentados de ir al mercado en un único sistema de registros y utiliza agentes impulsados por OpenAI para proporcionar insights y automatizar los flujos de trabajo para los equipos de ventas. El enfrentamiento de datos y el procesamiento de agentes continuos a través de millones de interacciones de ventas conducen al uso pesado de tokens. . El perfil abierto Salesforce Salesforce es un gigante de CRM que incorpora AI profundamente en sus productos. Su oferta de GPT de Einstein se basa en los modelos de lenguaje de OpenAI y genera contenido personalizado (e-mails, acciones de ventas, código) directamente en los dashboards de Salesforce. El sistema automatiza tareas de rutina como redactar correos electrónicos y resumir registros para millones de usuarios, lo que lleva a un uso de token extremadamente alto. . La visión general de Salesforce Einstein Página AI Sider es una extensión de navegador que actúa como un asistente de IA todo-en-uno. Da a los usuarios acceso a múltiples modelos de IA (ChatGPT, Claude, Gemini), resume artículos, lleva a cabo chats de grupo, resume vídeos de YouTube y proporciona herramientas como Wisebase (base de conocimientos), ChatPDF y diapositivas de IA. Soportar una amplia gama de funciones para millones de usuarios lleva a un gran número de llamadas y respuestas tokenizadas. . El Sider AI Revisión Shopify Shopify potencia más de un millón de tiendas en línea. OpenAI se asoció con Etsy y Shopify para permitir a los usuarios comprar artículos directamente a través de ChatGPT, con comerciantes de Shopify capaces de vender dentro de la conversación sin redirigir. Combine eso con Shopify Magic, el asistente generativo-AI de la plataforma para descripciones de productos y copias de marketing, y está claro por qué el uso de token es tan alto. . El anuncio de Reuters T-Móvil T-Mobile está aprovechando la IA generativa para el apoyo al cliente. está construyendo IntentCX, una plataforma de toma de decisiones de IA orientada a la intención en tiempo real con OpenAI que proporcionará las próximas mejores acciones y reducirá las llamadas de servicio en hasta el 75%. Analizar el sentimiento del cliente y guiar a agentes virtuales y humanos a través de decenas de millones de interacciones genera un uso masivo de tokens. . Artículo del CX de hoy Análisis del tigre Tiger Analytics es una firma de consultoría especializada en análisis avanzados y IA. En 2024, la compañía anunció una colaboración estratégica con AWS para acelerar el desarrollo y implementación de soluciones de IA generativas, combinando su experiencia de dominio con la infraestructura de AWS. Construir modelos generativos personalizados para clientes empresariales -incluyendo tuberías de generación aumentadas por recuperación y variantes de GPT ajustadas - impulsa un uso significativo de tokens. . Comunicado de prensa de CRN India Página web.dev Warp.dev construye un terminal moderno, alimentado por la IA. Warp integra la IA para sugerir comandos, generar código, solucionar errores y proporcionar una experiencia similar a la IDE. Características como Warp Drive permiten a los usuarios guardar comandos reutilizables y runbooks interactivos, mientras que el asistente de IA puede planificar y ejecutar flujos de trabajo complejos. Cada interacción con la IA invoca modelos de lenguaje, lo que resulta en un alto consumo de token. . La visión general de Warp AI ¿Quién WHOOP es una compañía de fitness portátil que ofrece entrenamiento de salud personalizado. El entrenador de la compañía con potencia GPT-4 responde a preguntas sobre rutinas de entrenamiento, recuperación y sueño utilizando los datos recopilados por la cinta WHOOP, proporcionando orientación siempre en línea. Dado que los datos de los sensores de cada usuario se convierten en prompts, el uso de token naturalmente skyrockets. . La historia de éxito de OpenAI Zendesk Zendesk es una plataforma de experiencia del cliente.La compañía se ha asociado con OpenAI y ha lanzado GPT-4o a todos los clientes de Zendesk AI, permitiendo respuestas generativas que son tres veces más rápidas y más precisas en la generación de respuestas similares a las humanas de las bases de conocimiento.Al alimentar robots de escritorio de ayuda, ayuda de agentes y herramientas de administración en miles de empresas, el consumo de token de Zendesk sube rápidamente. . Noticias de Zendesk ¿Es el uso de token pesado bueno o malo? Al final de la lista, uno debe preguntar si quemar a través de billones de tokens es un signo de crecimiento saludable o gasto en fuga. "Esto es como gastar un millón de dólares en juegos de azar y el casino te da una habitación de hotel gratuita para la noche" - una manera colorida de señalar que el cálculo de combustión no garantiza el valor a largo plazo.Algunas de estas compañías de IA han gastado miles de millones de tokens en APIs de OpenAI, lo que puede impresionar a los pares, pero podría asustar a los inversores si los costos superan los ingresos. La periodista Lauren Goode Por el lado positivo, el uso de token pesado suele indicar una fuerte adopción de productos e integración profunda de la IA generativa en los flujos de trabajo, lo que puede justificar mayores valoraciones a través de la mejora de la productividad y la satisfacción del cliente. Créditos de imagen: Dioniso Das Los datos extrapolados de la demostración de OpenAI el día de un billón de tokens consumidos. Dioniso Das