paint-brush
קוד פתוח: השלב הבא במהפכת הבינה המלאכותיתעל ידי@minio
109,673 קריאות
109,673 קריאות

קוד פתוח: השלב הבא במהפכת הבינה המלאכותית

על ידי MinIO6m2024/01/25
Read on Terminal Reader
Read this story w/o Javascript

יותר מדי זמן; לקרוא

חקירה זו של עתיד הבינה המלאכותית בקוד פתוח תנתח את "המתחזים" ותממן את "האמיתיים" בפיתוח בינה מלאכותית כדי לחשוף את מנוע החדשנות שהוא תוכנת קוד פתוח המזמזמת מתחת לכל זה. השורה התחתונה היא שבינה מלאכותית בקוד פתוח תוליד מחסנית נתונים בקוד פתוח.

People Mentioned

Mention Thumbnail
featured image - קוד פתוח: השלב הבא במהפכת הבינה המלאכותית
MinIO HackerNoon profile picture
0-item
1-item


תארו לעצמכם עתיד שבו בינה מלאכותית אינה נעולה בכספות של תאגידים, אלא נבנית בשטח פתוח, לבנה אחר לבנה, על ידי קהילה גלובלית של חדשנים. כאשר שיתוף פעולה, לא תחרות, מעודד התקדמות, ושיקולים אתיים מחזיקים במשקל שווה לביצועים גולמיים. זה לא מדע בדיוני, זו מהפכת הקוד הפתוח המתבשלת בלב פיתוח הבינה המלאכותית. אבל ל-Big Tech יש אג'נדה משלה, המסווה מודלים מוגבלים כקוד פתוח תוך ניסיון לקצור את היתרונות של קהילה פתוחה באמת.


בואו נקלף את שכבות הקוד ונחשוף את האמת מאחורי המאמצים הללו. חקירה זו של העתיד של בינה מלאכותית בקוד פתוח תנתח את "המתחזים" ותממן את "האמיתיים" בפיתוח בינה מלאכותית כדי לחשוף את מנוע החדשנות שהוא תוכנת קוד פתוח המזמזמת מתחת לכל זה. השורה התחתונה היא שבינה מלאכותית בקוד פתוח תוליד מחסנית נתונים בקוד פתוח.


הצורך

מאמר אחרון מאת מתאו וונג ב-The Atlantic, ' מעולם לא היה דבר כזה AI 'פתוח' ' מתאר מגמה הולכת וגוברת באקדמיה ובקהילת התוכנה ל-AI בקוד פתוח באמת. "הרעיון הוא ליצור מודלים שקופים יחסית שהציבור יוכל להשתמש, ללמוד ולשכפל בקלות ובזול יותר, תוך ניסיון לדמוקרטיזציה של טכנולוגיה מרוכזת מאוד שעשויה להיות בעלת פוטנציאל לשנות עבודה, משטרה, פנאי ואפילו דת". אותה אטלנטיק מציעה שחברות ביג טק כמו Meta מנסות למלא את הצורך הזה בשוק על ידי 'כביסה פתוחה' של המוצרים שלהן. הם מניחים את האיכויות ואת המוניטין החיובי של קהילת הקוד הפתוח מבלי לבצע באמת מקורות פתוחים למוצר שלהם. אבל, אין תחליף לדבר האמיתי. הסיבה לכך היא שתוכנת קוד פתוח אמיתית מניעה חדשנות ושיתוף פעולה: שתי תכונות שדרושות נואשות כדי להתקדם עם AI בצורה אחראית.


המעמידים פנים

LLaMA 2, הוא מודל שפה גדול שנוצר על ידי Meta והוא חופשי לשימוש לשימושים מחקריים ומסחריים כאחד. מה שמוביל כמה להציע ש-LAMA 2 הוא קוד פתוח. עם זאת, Meta הטמיעה כמה הגבלות חמורות על השימוש במודל שלהם. לדוגמה, לא ניתן להשתמש ב-LAMA 2 לשיפור כל מודל שפה גדול אחר. עמדה הנוגדת את המסורתי מודל חדשנות קולקטיבי פרטי של תוכנה פתוחה אשר מקדמת את הגילוי החופשי והפתוח של חדשנות לטובת כולם בקהילת התוכנה.


Meta פגע עוד יותר בשימוש במודל שלהם בכך שלא אפשרו אינטגרציה של LLaMA 2 עם מוצרים שיש להם 700 מיליון משתמשים חודשיים ובכך שלא חשפו על אילו נתונים המודל שלהם מאומן או הקוד שבו השתמשו לבנייתו. בכך שהיא לא חושפת, מטה פותחת את עצמה לשאלות של הטיה אינהרנטית ואפליה מקרית. מודל מאומן על נתונים מפלים יהיה להגיש תגובות מפלות . מבלי שקהילת התוכנה בכללה תוכל לראות את הקוד ששימש לבניית המודל כדי לראות אם הוגדרו אמצעי הגנה כלשהם או את הנתונים ששימשו להכשרתו, אנו נותרים בחושך בשאלות המוסריות הללו. בתקופה שבה פרסם מחקר על AI עוסק יותר בביצועים מאשר בצדק וכבוד הערפול הזה מטריד במיוחד.


האמיתיים

Mistral AI זכתה להכרה בדגמי השפה הגדולים שלה בקוד פתוח, בעיקר Mistral 7B ו-Mixtral 8x7B. החברה שואפת להבטיח נגישות רחבה לדגמי הבינה המלאכותית שלה, תוך עידוד סקירה, שינוי ושימוש חוזר על ידי קהילת התוכנה הפתוחה.


vLLM ראשי תיבות של "הגשה של מודלים עם חביון נמוך ב-vectorized" והיא ספריית קוד פתוח שתוכננה במיוחד כדי להאיץ ולייעל מודלים של שפה גדולה (LLMs). זהו כלי רב עוצמה שיכול לשפר משמעותית את הביצועים והשימושיות של LLMs. זה הופך אותו לנכס בעל ערך עבור מפתחים העובדים על מגוון יישומי בינה מלאכותית, מצ'אטבוטים ועוזרים וירטואליים ועד ליצירת תוכן ויצירת קוד. עד כדי כך, מיסטרל ממליצה להשתמש ב-vLLM כשרת ההסקות עבור דגמי 7B ו-8x7B.


EleutherAI היא מעבדת מחקר בינה מלאכותית ללא מטרות רווח שגדלה משרת Discord לדיון ב-GPT-3 לארגון מחקר מוביל ללא מטרות רווח. הקבוצה ידועה בעבודתה בהדרכה וקידום נורמות מדעיות פתוחות בעיבוד שפה טבעית. הם פרסמו מודלים שונים של שפות גדולות בקוד פתוח והם מעורבים בפרויקטים מחקריים הקשורים ליישור AI ולאפשרות פרשנות. שֶׁלָהֶם LM-רתמה הפרויקט הוא ככל הנראה כלי ההערכה המוביל בקוד פתוח עבור מודלים של שפות.


פי-2 הוא ה-LLM של מיקרוסופט שמכה מעל משקלו. המודל הקטן, אך העוצמתי הזה, מאומן על שילוב של טקסטים סינתטיים ואתרי אינטרנט מסוננים, מצטיין במשימות כמו מענה על שאלות, סיכום ותרגום. מה שבאמת מייחד את Phi-2 הוא ההתמקדות שלו בהיגיון והבנת שפה, מה שמוביל לביצועים מרשימים גם ללא טכניקות יישור מתקדמות.


מודלים רבים של הטמעת קוד פתוח מוכשרים מחזקים את מרחב הבינה המלאכותית היצירתית הכוללת של קוד פתוח. אלה הם העדכניים העדכניים ביותר עבור קוד פתוח וכוללים איחוד האמירויות הערביות-Large-V1 ו multilingual-e5-largel .


יש עוד רבים בתחום ההולך וגדל הזה. רשימה מוגבלת זו היא רק התחלה.


קוד פתוח מניע חדשנות

מאמצות פילוסופיה של חדשנות פתוחה קיצונית, חברות המשתתפות באמת בפיתוח תוכנה בקוד פתוח מאתגרות את התפיסות המסורתיות של יתרון תחרותי על ידי הכרה בכך. לא כל הקוד הטוב או הרעיונות הגדולים נמצאים בתוך הארגון שלהם . משמרת זו תומכת ב טַעֲנָה שחידושים משותפים בתוך המערכת האקולוגית של הקוד הפתוח מובילים לצמיחת שוק מהירה יותר, ומספקים אפילו לחברות תוכנה קטנות יותר מכספי מו"פ מוגבלים יותר הזדמנות להפיק תועלת מזרימת מו"פ הקיימת בתוכנת קוד פתוח. הסיבה לכך היא שבניגוד למיקור חוץ מסורתי, חדשנות פתוחה משפר משאבים פנימיים על ידי מינוף האינטליגנציה הקולקטיבית של הקהילה, מבלי להפחית את מאמצי המו"פ הפנימיים. המשמעות היא שחברות תוכנה בקוד פתוח אינן צריכות להקריב את התקציבים שלהן כדי לרדוף אחרי מנהיגות מחשבתית וקוד מחוץ לארגון שלהן.


בנוסף, חברות תוכנה בקוד פתוח מניעות את החדשנות באופן אסטרטגי שחרור קוד מוקדם ולעתים קרובות , מתוך הכרה באופי המצטבר של תהליך החדשנות בקהילת התוכנה. כל זה אומר משהו שרבים כבר מכירים: תוכנת קוד פתוח מניעה חדשנות.


קוד פתוח מטפח שיתוף פעולה

בְּאֶמצָעוּת רשת בקהילת התוכנה בקוד פתוח, יזמים מסוגלים להגשים יעדים קצרי טווח וגם לטווח ארוך. יעדי רווח לטווח קצר בונים חברות ויעדי רווח לטווח ארוך מקיימים אותם. במקביל, מאמץ הנטוורקינג הזה מנציח את הרשת עצמה - מצמיח אותה עבור היזם הבא. ידוע שפלטפורמות קוד פתוח מספקות גישה לקוד המקור, מה שמאפשר למפתחים ליצור שדרוגים, פלאגינים ושאר חלקי תוכנה ולהשתמש בהם בהתאם לדרישותיהם. סוג מסוים של שיתוף פעולה זה חווה פריחה עם האימוץ הרחב של Kubernetes על ידי קהילת התוכנה הרחבה יותר. כעת, יותר מתמיד, טכנולוגיות מודרניות עובדות יחד עם מעט מאוד חיכוך ויכולות להיות ביחד תוך דקות כמעט בכל מקום.


חברות ביג טק מכירות בשיתוף הפעולה העמוק הזה הטבוע בקהילת הקוד הפתוח כשהן משחררות בחופשיות מסגרות, ספריות ושפות שיצרו כדי לתחזק ולפתח כלים פנימיים. פעולה זו מעמיקה את מאגר המפתחים המסוגלים לעבוד על המוצרים שלהם ומתחילה לקבוע את הסטנדרט כיצד טכנולוגיות דומות צריכות לפעול. אותו מאמר באטלנטיק מצטט את מייסד Meta, מארק צוקרברג, שאמר ש"היה מאוד יקר עבורנו לספק זאת מכיוון שכעת כל המפתחים הטובים ביותר ברחבי התעשייה משתמשים בכלים שאנו משתמשים בהם גם באופן פנימי".


קוד פתוח מוליד קוד פתוח

אלו הם גורמים שבגללם אנו רואים לעתים קרובות מאוד סינרגיות בין חברות קוד פתוח. חברות בינה מלאכותית ו-ML בקוד פתוח יפתחו באופן טבעי פתרונות עם מוצרי קוד פתוח אחרים ממוצרים בסיסיים כמו אחסון אובייקטים וכלה במעלה הערימה וכלי הדמיה. כאשר חברת קוד פתוח אחת צועדת קדימה, כולנו עושים זאת. הגישה המגובשת והמשולבת הזו היא כנראה ההימור הטוב ביותר שלנו לפיתוח בינה מלאכותית הנוקטת גישה ממוקדת באדם. כוחות טבעיים אלו הטבועים בצורך בשוק ב-AI בקוד פתוח בשילוב עם האיכויות של תוכנת קוד פתוח של חדשנות ושיתוף פעולה יניעו את מחסנית הנתונים בינה מלאכותית בקוד פתוח.


אנא הצטרף ותרום לשיחה זו ולקהילה שלנו על ידי שלח לנו דוא"ל לכתובת [email protected] או לשלוח לנו הודעה בערוץ Slack שלנו.


פורסם גם כאן .