אני מבלה את הימים שלי בונים יישומים של AI שהופכים את הכאוס למבנה.תנו לי ערכת נתונים מבולבלת, כמה לוגיקה עסקית, מודל חזק מספיק, ואני יכול לחלץ אות מהרעש. אז כאשר רציתי להבין מה מודלים שפות גדולים באמת מבינים, עשיתי מה שכל מהנדס יעשה: פעלתי ניסוי. נכנס ל-LLM ושאל אותו לנתח מה הם מתכוונים. משוררים התוצאות היו מושלמות מבחינה טכנית.המודל זיהה את התוכנית, הסביר את המטאפורות, מפה את המתח המבני בין מושגים מתנגדים. אבל כשראיתי את זה עובד, הבנתי שעשיתי טעות קטגוריה. מה שהמודל לא רואה קח שורה כמו "הצמיחה של עמוד האפל האפל / מחסור בצל." LLM יכול לומר לך מילים אלה ליצור תערובת של נוכחות וחוסר, צמיחה ואובדן. הוא לא יכול לשבת עם אי נוחות שקטה ביטוי זה יוצר במערכת העצבים האנושית.השמעות אינה במילים עצמן. What it cannot do is feel the specific weight of growth that is shadowed by loss השירים לא ביקשו להיות מעודכנים, הם ביקשו להיות מנוסים. הבעיה שחשובה באמת זה לא רק על שירה, זה על המוצרים שאנחנו בונים בעולם של אינטגרציה LLM בכל מקום היום. כמה פעמים התקרבתי לבעיה של משתמש בדיוק באותו אופן שבו התקרבתי לשיר הזה? מחפש את מה שניתן לחלץ, למדוד, להירשם ולהזין לתיקיה. אנו נעשים אובססיביים עם חיתוך התנהגות המשתמש. האמיתות החשובות ביותר על מוצר אינן נמצאות בתוצאות הבדיקה A/B. הן נמצאות בדברים שמתנגדים למדידה: התסכול העדין של ניווט בממשק מבולבל. ההנאה הבלתי צפויה כאשר משהו עובד בצורה אינטואיטיבית יותר מהצפוי. אלה אינם נקודות נתונים, הם חוויות אנושיות, וכלים הטובים ביותר שלנו לעתים קרובות עיוורים להם. מה זה אומר על מה שאנחנו בונים מערכות ה-AI שאנו בונים יהיו טובות באופן אקספוננציאלי בזיהוי דפוסים וניתוח. אבל הדברים שמתנגדים להפחתה זו: האינטואיציה, המשמעות, ההרגשה של אמון; אלה נשארים אנושיים עמוקות, ולעתים קרובות הם מה שמחליט אם המוצרים שלנו באמת חשובים לאנשים. המשימה שלנו היא לא רק לבנות decoders חזקים יותר.זה להיות חכם כדי לזהות מה עומד מעבר לנתונים. לא כל מה שחשוב ניתן לפענח, יש דברים שחייבים לחיות. זה כולל את המוצרים שאנו מבקשים מהאנשים לחיות איתם.