Modelele lingvistice mari sunt o parte esențială a produselor digitale moderne. În partea de sus a acestui val sunt companiile care au ars mai mult de un trilion de jetoane OpenAI. Tabelul, extrapolat dintr-o prezentare recentă a zilei de demo OpenAI și, în consecință, a început să circule pe X / Twitter, enumeră 30 de clienți care au consumat colectiv o cantitate uimitoare de apeluri AI API. Mai jos este o privire mai profundă la ceea ce face fiecare companie, cum implementează AI generativă și o scurtă privire la motivul pentru care și cum utilizarea jetoanelor lor poate fi atât de mare. Lista este ordonată alfabetic de companie, în timp ce tendința imaginii de mai sus a fost ordonată alfabetic de numele reprezentantului companiei. Abridge Abridge este o companie de inteligență artificială de mediu axată pe documentarea asistenței medicale. Înregistrează conversațiile medic-pacient și le rezumă în note clinice structurate (note SOAP) folosind modele avansate de procesare a limbii naturale și de învățare automată, generând rezumate în timp real, elemente de acțiune și termeni medicali cheie. Cu mii de clinicieni care folosesc Abridge pentru a transcrie și rezuma consultări lungi, numărătoarele de token se măsoară rapid. . Prezentare generală a Abridge AI Canva Canva este o platformă de comunicare vizuală cu 175 de milioane de utilizatori lunar. Un studiu de caz OpenAI descrie modul în care Magic Studio de la Canva utilizează GPT-4 pentru generarea de conținut multimodal, permițând caracteristici precum Magic Write (generarea de text), Magic Design (crearea de prezentări și videoclipuri), Magic Switch (traducerea și adaptarea conținutului) și multe altele. . Studiu de caz Canva Cognitivă Cognition AI este startup-ul din spatele lui Devin, considerat primul inginer de software AI din lume. Devin, alimentat de modelul de fundație GPT-4 al OpenAI, poate aborda în mod autonom sarcini complexe de inginerie, cum ar fi scrierea de coduri, debugarea și implementarea aplicațiilor. Rularea buclelor agentice pentru a planifica, codifica și testa software-ul necesită ferestre lungi de context și pași de raționament repetați, determinând utilizarea tokenului. . Analiza fluxului vocal Codecă CodeRabbit oferă servicii de revizuire automată a codului și de asigurare a calității. folosește modelele OpenAI pentru a analiza diferențele, a raționa cu privire la structura programului și a propune remedii; revizuirea continuă a codului în mii de depozite duce la numărări extrem de mari de token-uri. Pentru mai mult. Pagina de produse CodeRabbit Dată Datadog este o platformă de observare utilizată de dezvoltatori și de echipele de operațiuni. La conferința sa 2023 Dash, compania a introdus Bits AI, un asistent digital construit pe OpenAI's ChatGPT care prezintă recomandări în timp real pentru probleme precum alerte și anomalii și a lansat un produs numit LLM Observability pentru a monitoriza LLM-urile personalizate. Deoarece Bits AI este integrat în tablouri de bord care monitorizează mii de servicii și log-uri și pentru că LLM Observability analizează solicitările și răspunsurile, numărul de jetoane este imens. . Despre DevOps.com Decanul Decagon oferă asistență pentru clienți complet automatizată. folosește GPT-3.5, GPT-4, și GPT-4o pentru a alimenta roboții agenți care se ocupă de milioane de conversații cu clienții în întreprinderi precum Duolingo, Notion și Substack. Acești roboți se ocupă de întregul ciclu de viață al asistenței - răspunzând la întrebări, rezolvând probleme și escaladând atunci când este necesar - provocând creșterea numărului de jetoane. . Povestea Decagonului Delfină Delphi construiește chatbots personalizate „Digital Minds” pentru creatori și influențatori. Pipeline-ul său de generare îmbunătățit prin recuperare (RAG) consumă podcast-uri, PDF-uri și social media pentru a instrui acești chatbots și utilizează o bază de date vectorială gestionată pentru a stoca mai mult de 100 de milioane de încorporări. Formarea și actualizarea a mii de persoane digitale în diferite surse de conținut determină utilizarea mare a token-urilor. . Acest raport despre scalarea Delphi cu RAG Duolingo Duolingo este cea mai mare aplicație de învățare a limbilor străine din lume, cunoscută pentru lecțiile sale gamificate și distribuția largă. A colaborat cu OpenAI pentru a integra GPT-4 în Duolingo Max, care oferă caracteristici precum „Explain My Answer” și Role Play, permițând cursanților să aibă conversații cu un barista virtual sau ghid turistic și să primească feedback detaliat. . Acest articol se referă la caracteristicile AI ale lui Duolingo Genspark AI Genspark AI (cunoscut și sub numele de Sparks) este o startup chineză de inteligență artificială fondată de foștii directori ai Baidu, Eric Jing și Kay Zhu. Compania folosește o arhitectură Mixture-of-Agents care orchestrează peste 80 de instrumente din lumea reală pentru a îndeplini sarcinile utilizatorilor, a strâns 160 de milioane de dolari și a atras peste două milioane de utilizatori. . Introducere Genspark Harvey Harvey construiește instrumente securizate generative AI pentru drept, impozite și finanțe. Harvey a colaborat cu OpenAI pentru a dezvolta un model de jurisprudență personalizat; platforma poate elabora documente, răspunde la întrebări despre scenarii de litigii și identifică discrepanțele în contracte. . Povestea lui Harvey Știri despre HubSpot/Dashworks HubSpot a achiziționat Dashworks, un asistent de căutare a locurilor de muncă alimentat de IA. Dashworks conectează date între aplicații, efectuează căutări profunde și rezumă detalii importante. Echipa sa va ajuta la construirea de asistenți AI pentru fiecare lucrător care merge pe piață. Capacitatea Dashworks de a ingera și de a raționa asupra bazelor de cunoștințe corporative utilizează ferestre mari de context; integrarea acestui lucru în Breeze Copilot a HubSpot multiplică utilizarea token-urilor în mii de clienți. . Anunțul lui HubSpot Soluții iSolutionsAI construiește modele personalizate de învățare automată și chatbots AI pentru întreprinderi. Integrarea modelelor OpenAI în fluxul de lucru al fiecărui client are ca rezultat multe ferestre de context lungi (cereri ale clienților, istorii CRM etc.), ceea ce explică volumul mare de token. . Pagina serviciilor iSolutionsAI într-adevăr De fapt, operează cea mai mare piață de locuri de muncă din lume. Echipa sa de inginerie a folosit de mult timp algoritmi de învățare automată pentru a se potrivi cu solicitanții de locuri de muncă și cu angajatorii și, în ultimii ani, a adăugat modele de inteligență artificială generatoare pentru a îmbunătăți aceste recomandări. . Interviu cu CIO JetBrains JetBrains face instrumente populare pentru dezvoltatori, cum ar fi IntelliJ și PyCharm. Asistentul său AI este alimentat de API-ul OpenAI, pe care compania l-a integrat datorită raționamentului său avansat și ușurinței de utilizare. Asistentul ajută milioane de dezvoltatori să genereze teste, cod refactor, să scrie mesaje de comit și să clarifice erorile. Având în vedere amploarea bazei sale de utilizatori, chiar și sugestiile simple de cod se traduc în număruri uriașe de jetoane. . JetBrains’ Asistent AI FAQ Piaţa liberă Mercado Libre este cea mai mare companie de comerț electronic și fintech din America Latină. Compania a construit Verdi, o platformă de dezvoltare AI care utilizează GPT-4o și alte modele pentru a gestiona sarcini complexe, cum ar fi medierea serviciilor pentru clienți, detectarea fraudelor, localizarea și rezumarea recenziilor. . Prezentare generală Verdi Noţiunea Notion este un spațiu de lucru conectat pentru scriere, planificare și managementul cunoștințelor. A transformat produsul său într-o platformă puternic alimentată de AI prin integrarea modelelor OpenAI pentru a rezuma paginile, a genera scrierea și a răspunde la întrebări în întregul spațiu de lucru. Combinația dintre o bază de utilizatori masivă și caracteristici generative precum Notion AI duce la o amprentă de token uriașă. . Povestea deschiderii OpenRouter OpenRouter rulează o API în stil de piață care permite dezvoltatorilor să acceseze sute de modele de limbi mari printr-un singur punct de terminare. Platforma acceptă modelele OpenAI, Anthropic, Google, Meta și Mistral și se ocupă automat de trimiterea înapoi și eficientă din punctul de vedere al costurilor. Deoarece fiecare cerere făcută de mii de aplicații client este proxy prin OpenRouter, numărul cumulativ de jetoane al companiei a crescut rapid. . Prezentare generală OpenRouter Exodului Outtake oferă automatizarea securității cibernetice bazată pe IA. Platforma sa de agenți detectează și remediază atacurile în câteva ore, automatizând atât detectarea, cât și răspunsul. Sarcinile de lucru în domeniul securității cibernetice necesită analizarea jurnalelor extinse și a fluxurilor de telemetrie; utilizarea modelelor OpenAI pentru sortarea, explicarea avertismentelor și generarea de scripturi de remediere consumă miliarde de jetoane. . Povestea securității cibernetice perplexitate Perplexity AI este un motor de căutare bazat pe IA care răspunde la întrebări cu surse citate. Abonamentul Perplexity Pro include modele avansate de la OpenAI, cum ar fi modelele GPT-5 și o-series ale OpenAI, alături de modelele antropice și open-source. Când utilizatorii efectuează căutări profesionale, sistemul poate apela la modele OpenAI pentru raționament profund și căutare web. . Articolul de ajutor Perplexity Pro Rampă Ramp este o companie fintech care automatizează cheltuielile corporative. Agenții săi AI automatizează raportarea cheltuielilor, achizițiile și contabilitatea. Acești agenți, construiți pe modelele OpenAI, trebuie să analizeze și să interpreteze chitanțele, e-mailurile și facturile la scară; fiecare document contribuie cu jetoane, iar volumul agregat de la mii de clienți depășește rapid un trilion. . Raportul PYMNTS Citește AI Read AI creează instrumente de productivitate a întâlnirilor care rezumă automat conversațiile, e-mailurile și chat-urile. Ascultă apelurile Zoom sau Google Meet și rezumă rapid conversațiile, furnizând transcrieri, coaching și condensarea mesajelor prin intermediul firmelor de e-mail. . Articolul din Siliconangle Roxă Rox construiește o platformă de operațiuni de venituri bazată pe IA. Unifică datele fragmentate de pe piață într-un singur sistem de înregistrări și utilizează agentii OpenAI pentru a furniza informații și a automatiza fluxurile de lucru pentru echipele de vânzări. . Profilul de deschidere Salesforce Salesforce este un gigant CRM care integrează AI adânc în produsele sale. Oferta sa Einstein GPT este construită pe modelele lingvistice ale OpenAI și generează conținut personalizat (e-mailuri, acțiuni de vânzări, cod) direct în tablourile de bord ale Salesforce. Sistemul automatizează sarcinile de rutină, cum ar fi redactarea de e-mailuri și rezumarea înregistrărilor pentru milioane de utilizatori, conducând la o utilizare extrem de ridicată a token-urilor. . Prezentare generală Salesforce Einstein Siderul AI Sider este o extensie de browser care acționează ca un asistent AI all-in-one. Acesta oferă utilizatorilor acces la mai multe modele AI (ChatGPT, Claude, Gemini), rezumă articole, desfășoară chat-uri de grup, rezumă videoclipuri YouTube și oferă instrumente cum ar fi Wisebase (baza de cunoștințe), ChatPDF și diapozitive AI. Suportul pentru o astfel de gamă largă de funcții pentru milioane de utilizatori duce la un număr mare de solicitări și răspunsuri tokenizate. . The Sider AI revizuire Shopify Shopify alimentează mai mult de un milion de magazine online. OpenAI a colaborat cu Etsy și Shopify pentru a permite utilizatorilor să cumpere articole direct prin ChatGPT, iar comercianții Shopify sunt capabili să vândă în conversație fără redirecționări.Combinați acest lucru cu Shopify Magic, asistentul generativ AI al platformei pentru descrieri de produse și copie de marketing, și este clar de ce utilizarea token-urilor este atât de mare. . Anunțul Reuters T-Mobilă T-Mobile utilizează inteligența artificială generatoare pentru asistența clienților. construiește IntentCX, o platformă de luare a deciziilor AI în timp real, bazată pe intenții, cu OpenAI, care va oferi următoarele acțiuni de top și va reduce apelurile de servicii cu până la 75%. . Articolul de azi CX Analiza tigrului Tiger Analytics este o firmă de consultanță specializată în analize avansate și inteligență artificială. În 2024, compania a anunțat o colaborare strategică cu AWS pentru a accelera dezvoltarea și implementarea soluțiilor de inteligență artificială generatoare, combinând expertiza domeniului cu infrastructura AWS. Construirea de modele de generare personalizate pentru clienții corporativi – inclusiv conducte de generare augmentate prin recuperare și variante GPT fine – conduce la utilizarea semnificativă a token-urilor. . Comunicat de presă al CRN India Cuvânt cheie.dev Warp.dev construiește un terminal modern, alimentat de AI. Warp integrează AI pentru a sugera comenzi, a genera coduri, a rezolva erorile și a oferi o experiență similară cu IDE. Caracteristici precum Warp Drive permit utilizatorilor să salveze comenzi reutilizabile și runbooks interactive, în timp ce asistentul AI poate planifica și executa fluxuri de lucru complexe. Fiecare interacțiune cu AI invocă modele de limbă, ceea ce duce la un consum ridicat de token. . The Warp AI Prezentare generală Whoop WHOOP este o companie de fitness portabilă care oferă coaching personalizat de sănătate. Coach-ul cu putere GPT-4 al companiei răspunde la întrebări despre rutina de antrenament, recuperare și somn folosind datele colectate de banda WHOOP, oferind îndrumare mereu la îndemână. Deoarece datele senzoriale 24/7 ale fiecărui utilizator sunt convertite în recomandări, utilizarea token-urilor crește în mod natural. . Povestea de succes a OpenAI Zendesk Zendesk este o platformă de experiență a clienților. Compania a încheiat un parteneriat cu OpenAI și a lansat GPT-4o tuturor clienților Zendesk AI, permițând răspunsuri generative care sunt de trei ori mai rapide și mai precise la generarea de răspunsuri similare cu cele ale oamenilor din baze de cunoștințe. . Știri despre Zendesk Este utilizarea de token-uri grele bună sau rea? La sfârșitul listei, trebuie să ne întrebăm dacă arderea prin trilioane de token-uri este un semn de creștere sănătoasă sau de cheltuieli nefolositoare. "Acesta este un fel de a cheltui un milion de dolari pe jocuri de noroc și cazinoul vă oferă o cameră de hotel gratuită pentru noapte" - o modalitate colorată de a observa că arderea calculului nu garantează o valoare pe termen lung. Jurnalistă Lauren Goode Pe partea pozitivă, utilizarea de token-uri grele indică de obicei adoptarea puternică a produselor și integrarea profundă a AI generative în fluxurile de lucru, ceea ce poate justifica evaluări mai mari prin îmbunătățirea productivității și a satisfacției clienților. Credit pentru imagine: Dăncilă Das Datele extrapolate de la demo-ul OpenAI în ziua în care un trilion de token-uri au consumat diapozitive. Dăncilă Das