מה אנחנו חושבים vs. מה אנחנו עושים כאשר אנו חושבים על האופן שבו אנשים משתמשים במודלים לשפות גדולות (LLMs), תמונה מוכרת מופיעה בראש: הפרודוקטיביות.אנחנו מדמיינים את המפתחים מתכנתים מהר יותר, אנשי שיווק כותבים דואר אלקטרוני, ואנליסטים מדגישים מסמכים צפופים. מחקר חדש וחדשני מ-OpenRouter, שמנתח יותר מ-100 טריליון טוקינים של שימוש בעולם האמיתי, חושף תמונה הרבה יותר מורכבת ומפתיעה. מה"אפליקציית הרוצח" אף אחד לא מדבר על תופעה מוזרה שמחליטה איזה מודלים ינצחו בטווח הארוך, הנתונים מאתגרים את ההנחות הבסיסיות שלנו על מצב ה- AI היום. למעשה המקרה הגדול ביותר של שימוש במקור פתוח AI אינו עובד; זה משחק. בניגוד לסיפור הדומיננטי של AI כמנוע הפרודוקטיביות, המקרה הגדול ביותר עבור דגמי קוד פתוח (OSS) הוא משחק תפקידים יצירתי.הנתונים מראים כי "שחקת תפקידים יצירתית" וסיפור סיפורים מהווים יותר ממחצית (כ-52%) מכלל השימוש בטוקן OSS, עם תכנות להיות שניה רחוקה. זהו גילוי משמעותי.זה מצביע על בסיס משתמשים גדול הופך מודלים פתוחים עבור חוויות אלה, כפי שהם מציעים חופש יצירתי גדול יותר ולעתים קרובות פחות מוגבל על ידי מסנני התוכן המסחריים שנמצאים במודלים קנייניים.ממצא זה מגלה ביקוש צרכנים גדול, חסר שירות עבור בידור מונע על ידי AI, חברה, ופיסיקה אינטראקטיבית.בעוד התעשייה מתמקדת פתרונות עסקיים, הרוב השקט משתמש AI כדי ליצור ולחקור עולמות חדשים. עלייתו השקטה של "סוכן AI" הדרך שבה אנשים משתמשים LLMs עובר שינוי יסודי. אנחנו עוזבים מן פשוט, סיבוב יחיד, שאלות ותשובות אינטראקציות לדרכים מרובות שלבים, זרימת עבודה משולבת כלים. שינוי זה ברור בנתונים: מודלים אופטימיים למחשבה מתמודדים כעת עם יותר מ-50% מכלל השימוש, עלייה דרמטית בהשוואה לכמות בלתי נמנעת בתחילת 2025.העבר לקראת המחשבה מונע על ידי עומסי עבודה מורכבים יותר, שכן ההזמנה הממוצעת של המשתמש גדלה כמעט פי ארבעה מאז תחילת 2024 כדי להתאים משימות כגון ניתוח מסדי קוד שלמים; מגמה המונעת בעיקר על ידי הזמנות תכנות, אשר הם 3-4 פעמים יותר מאשר אלה למטרה כללית. הדו"ח מציב את השינוי הזה במונחים חזקים, ומסכים כי ההשלכות הספציפיות הופכות במהירות לדפוס חדש לאינטראקציה עם AI. בקרוב מספיק, אם לא כבר, ההשלכות האגנטיות ייקחו על עצמן את רוב ההשלכות. הצלחה כבר לא תהיה רק על יצירת טקסט סביר, אלא על התמודדות עם משימות מורכבות, מדיניות הדורשות תכנון ופעולה. קוד פתוח תופס בשקט שליש מהשוק של AI בעוד מודלים בעלים של מעבדות גדולות כמו אנתרופיק ו-OpenAI עדיין מובילים בשוק, מודלים עם קוד פתוח גדלו בהדרגה כדי לכסות בערך שליש מכלל השימוש בטוקן עד סוף 2025. אחד הגורמים העיקריים להרחבה זו היה עליית מודלים OSS שפותחו בסין מפיצים כגון Qwen ו-DeepSeek. מגמה זו מצביעה על "מבנה כפול מתמשך" באקולוגיה של AI. המקור מצביע על כך שהאיזון בין מודלים קנייניים ו- OSS יציב כעת ב-30% עבור קוד פתוח. איזון זה קיים משום שהמפתחים בוחרים מערכות קנייניות עבור משימות עסקיות אמינות גבוהה, תוך שימוש ביעילות עלותית ובהתאמה אישית של OSS עבור עומסי עבודה קריטיים אחרים. מדוע AI אינו סחורה (אבל) רבים צפו כי מודלים AI יהפכו במהירות לסחורה זולה, עם המחיר להיות ההבדל העיקרי. הנתונים, עם זאת, מספרים סיפור שונה. הביקוש ל- LLMs הוא מפתיע מחיר-אינלסטי, כלומר שינויים במחירים יש השפעה קטנה על השימוש. על פי המחקר, ירידה במחיר של 10% מתאימה לעלייה קטנה של 0.5-0.7% בשימוש. במקום שוק מסחרי, המערכת האקולוגית מחולקת לארכיטיפים שונים: מנהיגים פרסומיים: מודלים כמו Claude 4 Sonnet של Anthropic שולטים במחירים גבוהים אבל עדיין רואים שימוש עצום, מה שמוכיח שהמשתמשים מוכנים לשלם פרמיה עבור איכות ברמה העליונה ואמינות. ענקים יעילים: מודלים כמו Google's Gemini Flash ו DeepSeek לשלב עלות נמוכה עם נפח גבוה, מה שהופך אותם לבחירה default עבור עלויות רגישות, משימות בקנה מידה גדול. מומחים פרסומיים: מודלים יקרים מאוד כמו GPT-5 Pro של OpenAI משמשים בצורה חסכונית למשימות בעלות ההימור הגבוה ביותר, שבהן הביצועים הם הדבר היחיד שחשוב והמחיר הוא משני. The Long Tail: מודלים כגון Qwen 2 7B Instruct ו- IBM Granite 4.0 Micro יש מחירים בסיסיים אבל טווח מוגבל, ומדגישים כי היכולת והתאימות לשוק המודל הם הבדלים קריטיים מעבר רק עלות. ספיגה זו חושפת תובנה קריטית על המצב הנוכחי של השוק. גמישות הביקוש הפשוטה יחסית מצביעה על כך LLMs עדיין לא סחורה; משתמשים רבים מוכנים לשלם פרמיה עבור איכות, יכולות, או יציבות. נכון לעכשיו, יכולות מיוחדות וביצועים אמינים לעיתים קרובות עולה כסף, במיוחד עבור עומסי עבודה מקצועיים או קריטיים למשימה. ניצחון ב- AI הוא כמו Cinderella's "Glass Slipper" בשוק שבו מודלים חדשים משוחררים כל הזמן, איך כל מודל יחיד בונה יתרון קבוע?המחקר מציע מסגרת חדשה בשם "התוצאה Glass Slipper" כדי להסביר את החזקת המשתמשים.הרעיון הוא פשוט: כאשר מודל חדש הוא הראשון לפתור צורך קריטי, לא פגוש בעבר עבור קבוצה של משתמשים, הוא משיג "תאים מושלם." המשתמשים המוקדמים האלה יוצרים "קוהורות בסיסיות" שמצטרפות למודל לטווח ארוך, ומראים שימור גבוה בהרבה מאשר משתמשים שמקבלים אותו מאוחר יותר. דוגמה ברורה ניתן לראות בקוהורט יוני 2025 עבור Gemini 2.5 Pro וקוהורט מאי 2025 עבור Claude 4 Sonnet, אשר שמרה על 40% מהמשתמשים שלהם חמישה חודשים מאוחר יותר; שיעור גבוה בהרבה מאשר הקוהורטות הבאות. תופעה זו פירושה כי בעולם המשתנה במהירות של ה- AI, היתרון "ראשון לפתור" הוא חזק ומאובטח להפליא.הסימן האמיתי של מודל חדשני הוא לא רק hype או benchmarks, אלא היווצרות שקטה של אלה, קבוצות משתמשים בסיסיות אשר מצאו את המתאים שלהם מושלם. מסקנה: הסיפור האמיתי של AI עדיין נכתב השימוש בעולם האמיתי של AI הוא הרבה יותר ניואנס, מגוון, ומפתיע מאשר הסיפור המוביל מציע. הנתונים מראים מערכת אקולוגית המונעת לא פחות על ידי יצירתיות משעשעת מאשר על ידי הפרודוקטיביות, אחד שמשתנה במהירות לעבר זרימות עבודה מורכבות, סוכנות. כאשר AI עובר מלהיות כלי פשוט לשותף מורכב, אילו התנהגויות בלתי צפויות ויישומים רוצחים יופיעו הבא? Podcast של Apple: כאן Spotify: כאן תגית: Apple Podcast כאן על Spotify: כאן