Les grands modèles linguistiques sont une partie essentielle des produits numériques modernes. Au sommet de cette vague sont les entreprises qui ont brûlé plus d'un trillion de jetons OpenAI. Le tableau, extrapolé à partir d'un récent diaporama OpenAI et par conséquent commencé à circuler sur X / Twitter, liste 30 clients qui ont collectivement consommé une quantité étonnante d'appels API d'IA. Ci-dessous est un regard plus profond sur ce que chaque entreprise fait, comment ils déploient l'IA générative, et un bref coup d'oeil sur pourquoi et comment leur utilisation de jetons peut être si élevée. La liste est ordonnée alphabétiquement par entreprise, alors que la tendance d'image ci-dessus a été ordonnée alphabéti Abridge Abridge est une société d'IA environnementale axée sur la documentation des soins de santé. Il enregistre les conversations médecin-patient et les résume en notes cliniques structurées (notes SOAP) en utilisant des modèles avancés de traitement de langue naturelle et d'apprentissage automatique, générant des résumés en temps réel, des éléments d'action et des termes médicaux clés. Avec des milliers de cliniciens utilisant Abridge pour transcrire et résumer de longues consultations, les comptes de jetons évoluent rapidement. . Voir tous les avis sur Abridge AI Canva Canva est une plateforme de communication visuelle avec 175 millions d’utilisateurs mensuels. Une étude de cas OpenAI décrit comment le Magic Studio de Canva utilise le GPT-4 pour la génération de contenu multimodal, permettant des fonctionnalités telles que Magic Write (génération de texte), Magic Design (création de présentations et de vidéos), Magic Switch (traduction et adaptation de contenu) et plus encore. . Étude de cas Canva Cognition Cognition AI est la startup derrière Devin, considérée comme le premier ingénieur logiciel d'IA au monde. Devin, alimenté par le modèle de base GPT-4 d'OpenAI, peut gérer de manière autonome des tâches d'ingénierie complexes telles que l'écriture de code, le débogage et le déploiement d'applications. Exécuter des boucles d'agent pour planifier, coder et tester des logiciels nécessite de longues fenêtres de contexte et des étapes de raisonnement répétées, conduisant à l'utilisation de jetons. . Analyse du flux vocal CodeRabbit CodeRabbit fournit des services d'examen automatique du code et d'assurance qualité. Il utilise les modèles d'OpenAI pour analyser les diffs, raisonner sur la structure du programme et proposer des correctifs; l'examen continu du code dans des milliers de dépôts conduit à des comptes de jetons extrêmement importants. pour plus. Page de produit CodeRabbit Données Datadog est une plate-forme d'observation utilisée par les développeurs et les équipes d'opérations. Lors de sa conférence 2023 Dash, la société a présenté Bits AI, un assistant numérique construit sur le ChatGPT d'OpenAI qui fournit des recommandations en temps réel pour des questions telles que les alertes et les anomalies, et a lancé un produit appelé LLM Observability pour surveiller les LLM personnalisés. Parce que Bits AI est intégré dans des tableaux de bord surveillant des milliers de services et de journaux, et parce que LLM Observability analyse les prompts et les réponses, le nombre de jetons est immense. . par DevOps.com Décadence Decagon fournit un support client entièrement automatisé. Il utilise GPT-3.5, GPT-4, et GPT-4o pour alimenter les robots d'agence qui gèrent des millions de conversations client à travers des sociétés telles que Duolingo, Notion et Substack. Ces robots gèrent l'ensemble du cycle de vie du support - répondre aux questions, résoudre les problèmes et évoluer au besoin - causant le nombre de jetons à augmenter. . L’histoire de la décadence Delphine Delphi construit des chatbots personnalisés « Digital Minds » pour les créateurs et les influenceurs. Son pipeline de génération augmentée par la récupération (RAG) ingère des podcasts, des PDF et des médias sociaux pour former ces chatbots et utilise une base de données vectorielle gérée pour stocker plus de 100 millions d’intégrations. La formation et la mise à jour de milliers de personnes numériques à travers diverses sources de contenu entraîne une utilisation élevée de jetons. . Ce rapport sur l'évolutivité de Delphi avec RAG Duolingo Duolingo est la plus grande application d’apprentissage des langues au monde, connue pour ses leçons jouées et sa large distribution. Il s’est associé à OpenAI pour intégrer GPT-4 dans Duolingo Max, qui offre des fonctionnalités telles que « Expliquer ma réponse » et « Role Play », permettant aux apprenants d’avoir des conversations avec un bariste virtuel ou un guide touristique et de recevoir des commentaires détaillés. Ces exercices personnalisés et conscients du contexte ne sont possibles que parce que chaque requête et réponse des apprenants est tokenisée, expliquant pourquoi l’entreprise a accumulé plus d’un milliard de jetons. . Cet article concerne les fonctionnalités du Duolingo Genspark à Genspark AI (également connu sous le nom de Sparks) est une startup chinoise fondée par les anciens dirigeants de Baidu Eric Jing et Kay Zhu. La société emploie une architecture Mixture-of-Agents qui orchestre plus de 80 outils du monde réel pour accomplir des tâches utilisateur, a collecté 160 millions de dollars et a attiré plus de deux millions d'utilisateurs. . Genspark Introduction Harvey Harvey construit des outils de génération d'IA sécurisés pour le droit, la fiscalité et la finance. Harvey s'est associé à OpenAI pour développer un modèle de jurisprudence personnalisé; la plateforme peut rédiger des documents, répondre à des questions sur les scénarios de litige et identifier les divergences dans les contrats. Avec les grandes firmes d'avocats générant et examinant des milliers de documents longs, les volumes de jetons sont énormes. . L’histoire de Harvey HubSpot et Dashworks HubSpot a acquis Dashworks, un assistant de recherche sur le lieu de travail alimenté par l'IA. Dashworks connecte les données à travers les applications, effectue des recherches profondes et résume les détails importants. Son équipe aidera à construire des assistants d'IA pour chaque travailleur allant sur le marché. La capacité de Dashworks à ingérer et à raisonner sur les bases de connaissances d'entreprise utilise de grandes fenêtres contextuelles; l'intégration de ceci dans le Breeze Copilot de HubSpot multiplie l'utilisation des jetons parmi des milliers de clients. . L’annonce de HubSpot Résolutions iSolutionsAI construit des modèles d'apprentissage automatique personnalisés et des chatbots d'IA pour les entreprises.L'intégration des modèles OpenAI dans le flux de travail de chaque client se traduit par de nombreuses fenêtres de contexte longues (quêtes clients, histoires CRM, etc.), ce qui explique le volume élevé de jetons. . La page des services iSolutionsAI En effet En effet, elle exploite le plus grand marché du travail au monde. Son équipe d'ingénieurs a longtemps utilisé des algorithmes d'apprentissage automatique pour correspondre aux demandeurs d'emploi et aux employeurs, et au cours des dernières années, elle a ajouté des modèles d'IA génératifs pour améliorer ces recommandations. . L’interview du CIO JetBrains JetBrains fabrique des outils de développement populaires tels que IntelliJ et PyCharm. Son assistant AI est alimenté par l'API d'OpenAI, que l'entreprise a intégré en raison de son raisonnement avancé et de sa facilité d'utilisation. L'assistant aide des millions de développeurs à générer des tests, un code réfacteur, écrire des messages de commissions et clarifier les erreurs. Compte tenu de l'échelle de sa base d'utilisateurs, même des suggestions de code simples se traduisent par un énorme nombre de jetons. . JetBrains’ Assistant AI FAQ Marché libre Mercado Libre est la plus grande entreprise de commerce électronique et de fintech d'Amérique latine. La société a construit Verdi, une plate-forme de développement d'IA qui exploite GPT-4o et d'autres modèles pour gérer des tâches complexes telles que la médiation du service à la clientèle, la détection de la fraude, la localisation et les critiques de synthèse. . Vue d'ensemble Verdi notion Notion est un espace de travail connecté pour l'écriture, la planification et la gestion des connaissances. Il a transformé son produit en une plate-forme profondément alimentée par l'IA en intégrant des modèles OpenAI pour résumer les pages, générer l'écriture et répondre aux questions dans l'espace de travail. La combinaison d'une base d'utilisateurs massive et de fonctionnalités génératrices telles que Notion AI conduit à une énorme empreinte token. . L’histoire de l’OpenAI OpenRouter OpenRouter exécute une API de style marché qui permet aux développeurs d'accéder à des centaines de grands modèles de langues à travers un seul endpoint. La plate-forme prend en charge les modèles OpenAI, Anthropic, Google, Meta et Mistral et gère automatiquement le retrait et le routage rentable. Parce que chaque demande faite par des milliers d'applications client est proxyée via OpenRouter, le nombre cumulatif de jetons de l'entreprise s'accumule rapidement. . Vue d'ensemble de OpenRouter extrait Outtake propose une automatisation de la cybersécurité basée sur l'IA. Sa plate-forme d'agence détecte et corrige les attaques en quelques heures, automatisant à la fois la détection et la réponse. Les charges de travail de cybersécurité nécessitent l'analyse de journaux étendus et de flux de télémétrie; l'utilisation de modèles OpenAI pour trier, expliquer les alertes et générer des scripts de réparation consomme des milliards de jetons. . L'histoire de la cybersécurité d'Outtake Perplexité Perplexity AI est un moteur de recherche alimenté par l'IA qui répond aux questions avec des sources citées. L'abonnement Perplexity Pro comprend des modèles avancés d'OpenAI, tels que les modèles GPT-5 et de la série o d'OpenAI, ainsi que des modèles anthropes et open-source. Lorsque les utilisateurs effectuent des recherches professionnelles, le système peut appeler des modèles OpenAI pour un raisonnement profond et une recherche web. Pour plus d'informations sur les modèles disponibles, voir . L'article de Perplexity Pro aide La rampe Ramp est une société de fintech qui automatise les dépenses d'entreprise. Ses agents d'IA automatisent les rapports de dépenses, les achats et la comptabilité. Ces agents, construits sur les modèles OpenAI, doivent analyser et interpréter les reçus, les e-mails et les factures à l'échelle; chaque document contribue à des jetons, et le volume agrégé de milliers de clients dépasse rapidement un milliard. . Rapport de PYMNTS Lire le Read AI crée des outils de productivité des réunions qui résument automatiquement les conversations, les e-mails et les chats. Il écoute les appels Zoom ou Google Meet et résume rapidement les conversations, fournissant des transcriptions, un coaching et des messages de condensation sur les fils de courrier électronique. . L’article de Siliconangle Rox Rox construit une plate-forme d'opérations de revenus axée sur l'IA. Il unifie les données fragmentées du go-to-market en un seul système d'enregistrement et utilise des groupes d'agents alimentés par l'OpenAI pour fournir des informations et automatiser les flux de travail pour les équipes de vente. . Le profil ouvert Salesforce Salesforce est un géant du CRM qui intègre l'IA profondément dans ses produits. Son offre Einstein GPT est construite sur les modèles linguistiques d'OpenAI et génère du contenu personnalisé (e-mails, actions de vente, code) directement dans les tableaux de bord de Salesforce. Le système automatise les tâches de routine telles que la rédaction d'e-mails et le résumé des enregistrements pour des millions d'utilisateurs, entraînant une utilisation extrêmement élevée des jetons. . Vue d'ensemble de Salesforce Einstein Le côté AI Sider est une extension de navigateur qui agit comme un assistant d'IA tout-en-un. Il donne aux utilisateurs accès à plusieurs modèles d'IA (ChatGPT, Claude, Gemini), résume des articles, conduit des chats de groupe, résume des vidéos YouTube et fournit des outils tels que Wisebase (base de connaissances), ChatPDF et diapositives d'IA. Soutenir une telle gamme de fonctions pour des millions d'utilisateurs conduit à un grand nombre de prompts et de réponses tokenisés. . Le côté de la revue Shopify Shopify alimente plus d'un million de magasins en ligne. OpenAI s'est associé à Etsy et Shopify pour permettre aux utilisateurs d'acheter des articles directement via ChatGPT, avec des commerçants Shopify capables de vendre à l'intérieur de la conversation sans redirections. Combinez cela avec Shopify Magic, l'assistant génératif AI de la plate-forme pour les descriptions de produits et la copie marketing, et il est clair pourquoi l'utilisation des jetons est si élevée. . L’annonce de Reuters T-Mobile T-Mobile exploite l'IA générative pour le support client. Il construit IntentCX, une plate-forme de décision d'IA en temps réel, axée sur l'intention avec OpenAI qui fournira les prochaines meilleures actions et réduira les appels de service jusqu'à 75 %. . L'article de CX aujourd'hui Tiger analytique Tiger Analytics est une société de conseil spécialisée dans l'analyse avancée et l'IA. En 2024, la société a annoncé une collaboration stratégique avec AWS pour accélérer le développement et le déploiement de solutions d'IA génératives, combinant son expertise de domaine avec l'infrastructure d'AWS. La construction de modèles génératifs personnalisés pour les clients d'entreprise - y compris les pipelines de génération augmentées par la récupération et les variantes de GPT finement ajustées - favorise une utilisation significative des jetons. . Le communiqué de presse de CRN India Télécharger.dev Warp.dev construit un terminal moderne alimenté par l'IA. Warp intègre l'IA pour suggérer des commandes, générer du code, résoudre les erreurs et fournir une expérience similaire à celle de l'IDE. Des fonctionnalités telles que Warp Drive permettent aux utilisateurs d'enregistrer des commandes réutilisables et des runbooks interactifs, tandis que l'assistant AI peut planifier et exécuter des flux de travail complexes. Chaque interaction avec l'IA invoque des modèles de langue, ce qui entraîne une consommation élevée de jetons. . Le Warp AI vue d'ensemble qui WHOOP est une entreprise de fitness portable qui offre un coaching de santé personnalisé. L'entraîneur de l'entreprise alimenté par GPT-4 répond à des questions sur les routines d'entraînement, la récupération et le sommeil en utilisant les données collectées par la ceinture WHOOP, fournissant des conseils toujours en ligne. Depuis que les données de capteurs 24/7 de chaque utilisateur sont converties en prompts, l'utilisation des jetons augmente naturellement. . L’histoire de succès d’OpenAI par Zendesk Zendesk est une plate-forme d'expérience client.La société s'est associée à OpenAI et a déployé GPT-4o à tous les clients de Zendesk AI, permettant des réponses génératives qui sont trois fois plus rapides et plus précises pour générer des réponses similaires à celles des bases de connaissances.En alimentant les robots de bureau, l'assistance d'agent et les outils d'administration dans des milliers d'entreprises, la consommation de jetons de Zendesk augmente rapidement. . Le communiqué Zendesk L'utilisation de jetons lourds est-elle bonne ou mauvaise? À la fin de la liste, il faut se demander si brûler des trillions de jetons est un signe de croissance saine ou de dépenses en fuite. "C'est comme dépenser un million de dollars en jeu et le casino vous donne une chambre d'hôtel gratuite pour la nuit" - une façon colorée de noter que brûler l'informatique ne garantit pas une valeur à long terme. La journaliste Lauren Goode Du côté positif, l’utilisation de jetons lourds indique généralement une forte adoption de produits et une intégration profonde de l’IA générative dans les flux de travail, ce qui peut justifier des évaluations plus élevées grâce à une productivité améliorée et à la satisfaction des clients. Crédit d’image : dédié à Les données extrapolées de la démonstration OpenAI le jour où un trillion+ de jetons ont consommé des diapositives. dédié à