تخيلوا مستقبلاً حيث لا يكون الذكاء الاصطناعي حبيساً في خزائن الشركات، بل يتم بناؤه في العراء، لبنة لبنة، من قبل مجتمع عالمي من المبتكرين. حيث يغذي التعاون، وليس المنافسة، التقدم، وحيث تكون الاعتبارات الأخلاقية لها نفس الوزن مع الأداء الخام. هذا ليس خيالاً علمياً، إنها ثورة مفتوحة المصدر تختمر في قلب تطوير الذكاء الاصطناعي. لكن شركات التكنولوجيا الكبرى لديها أجندتها الخاصة، حيث تخفي النماذج المقيدة تحت ستار مفتوح المصدر بينما تحاول جني فوائد مجتمع مفتوح حقًا.
دعونا نكشف عن طبقات الكود ونكشف الحقيقة وراء هذه الجهود. إن هذا الاستكشاف لمستقبل الذكاء الاصطناعي مفتوح المصدر سوف يشرح "المتظاهرين" ويدعم "الحقيقيين" في تطوير الذكاء الاصطناعي للكشف عن محرك الابتكار الذي يتمثل في البرمجيات مفتوحة المصدر. والخلاصة هي أن الذكاء الاصطناعي مفتوح المصدر سوف يولد مجموعة بيانات مفتوحة المصدر.
الحاجة
نُشرت مقالة حديثة بقلم ماتيو وونغ في مجلة The Atlantic بعنوان: لم يكن هناك شيء اسمه الذكاء الاصطناعي "المفتوح" من قبل "يصف هذا الاتجاه المتنامي في الأوساط الأكاديمية ومجتمع البرمجيات للذكاء الاصطناعي مفتوح المصدر حقًا. "الفكرة هي إنشاء نماذج شفافة نسبيًا يمكن للجمهور استخدامها ودراستها وإعادة إنتاجها بسهولة أكبر وبتكلفة أقل، في محاولة لإضفاء الطابع الديمقراطي على تقنية شديدة التركيز قد يكون لها القدرة على تحويل العمل والشرطة والترفيه وحتى الدين". يشير نفس الأطلسي إلى أن شركات التكنولوجيا الكبرى مثل Meta تحاول تلبية هذه الحاجة في السوق من خلال "غسل" منتجاتها علانية. إنهم يفترضون صفات وسمعة مجتمع المصدر المفتوح الإيجابية دون جعل منتجهم مفتوح المصدر حقًا. ولكن لا يوجد بديل للشيء الحقيقي. وذلك لأن البرمجيات مفتوحة المصدر الحقيقية تدفع الابتكار والتعاون: وهما صفتان مطلوبتان بشدة للمضي قدمًا في الذكاء الاصطناعي بشكل مسؤول.
المتظاهرون
LLaMA 2 هو نموذج لغوي كبير تم إنشاؤه بواسطة Meta وهو مجاني للاستخدام في البحث والاستخدامات التجارية. مما دفع البعض إلى اقتراح أن LLaMA 2 مفتوح المصدر. ومع ذلك، فقد طبقت Meta بعض القيود الصارمة على استخدام نموذجها. على سبيل المثال، لا يمكن استخدام LLaMA 2 لتحسين أي نموذج لغوي كبير آخر. وهو موقف يتعارض مع النهج التقليدي نموذج الابتكار الجماعي الخاص من البرمجيات المفتوحة التي تعزز الكشف الحر والمفتوح عن الابتكار لصالح الجميع في مجتمع البرمجيات.
لقد عملت شركة Meta على عرقلة استخدام نموذجها من خلال عدم السماح بدمج LLaMA 2 مع المنتجات التي لديها 700 مليون مستخدم شهريًا وعدم الكشف عن البيانات التي تم تدريب نموذجها عليها أو الكود الذي استخدموه لبنائه. من خلال عدم الكشف، تفتح Meta نفسها أمام أسئلة التحيز المتأصل والتمييز العرضي. النموذج الذي تم تدريبه على بيانات تمييزية سوف تقديم ردود فعل تمييزية في غياب قدرة مجتمع البرمجيات على عرض الكود المستخدم لبناء النموذج لمعرفة ما إذا كان قد تم تضمين أي ضمانات أو البيانات المستخدمة لتدريبه، فإننا نترك في الظلام بشأن هذه الأسئلة الأخلاقية. في وقت حيث الأبحاث المنشورة عن الذكاء الاصطناعي يهتم بالأداء أكثر من العدالة والاحترام، وهذا التعتيم مثير للقلق بشكل خاص.
الحقيقيون
ميسترال اي اي اكتسبت الشركة شهرة كبيرة بفضل نماذجها مفتوحة المصدر للغات الكبيرة، ولا سيما Mistral 7B وMixtral 8x7B. وتسعى الشركة إلى ضمان إمكانية الوصول على نطاق واسع إلى نماذج الذكاء الاصطناعي الخاصة بها، وتشجيع المراجعة والتعديل وإعادة الاستخدام من قبل مجتمع البرمجيات المفتوحة.
في القانون تعني "خدمة النماذج الموجهة منخفضة زمن الوصول" وهي مكتبة مفتوحة المصدر مصممة خصيصًا لتسريع وتحسين نماذج اللغة الكبيرة (LLMs). إنها أداة قوية يمكنها تحسين أداء وقابلية استخدام نماذج اللغة الكبيرة بشكل كبير. وهذا يجعلها أصلًا قيمًا للمطورين الذين يعملون على مجموعة متنوعة من تطبيقات الذكاء الاصطناعي، من برامج الدردشة والمساعدين الافتراضيين إلى إنشاء المحتوى وتوليد التعليمات البرمجية. لدرجة أن Mistral توصي باستخدام vLLM كخادم استدلال لنماذج 7B و8x7B.
إليوثيراي هو مختبر أبحاث غير ربحي للذكاء الاصطناعي نما من خادم Discord لمناقشة GPT-3 إلى منظمة بحثية غير ربحية رائدة. تشتهر المجموعة بعملها في تدريب وتعزيز معايير العلوم المفتوحة في معالجة اللغة الطبيعية. لقد أصدروا نماذج لغوية كبيرة مفتوحة المصدر مختلفة ويشاركون في مشاريع بحثية تتعلق بمحاذاة الذكاء الاصطناعي وقابليته للتفسير. تسخير LM من المحتمل أن يكون المشروع هو أداة التقييم مفتوحة المصدر الرائدة لنماذج اللغة.
فاي-2 إن برنامج Phi-2 هو برنامج ماجستير في القانون من مايكروسوفت، وهو برنامج يتفوق على كل البرامج الأخرى. فهو برنامج صغير الحجم ولكنه قوي، وقد تم تدريبه على مزيج من النصوص الاصطناعية ومواقع الويب المفلترة، ويتفوق في مهام مثل الإجابة على الأسئلة، والتلخيص، والترجمة. وما يميز برنامج Phi-2 حقًا هو تركيزه على المنطق وفهم اللغة، مما يؤدي إلى أداء مذهل حتى بدون تقنيات المحاذاة المتقدمة.
تعمل العديد من نماذج التضمين مفتوحة المصدر الكفؤة على تعزيز مساحة الذكاء الاصطناعي التوليدي مفتوحة المصدر بشكل عام. وهذه هي أحدث التطورات في مجال مفتوح المصدر وتشمل الإمارات العربية المتحدة-الكبيرة-V1 و متعدد اللغات-e5-largel .
هناك العديد من المجالات الأخرى في هذا المجال المتنامي باستمرار. وهذه القائمة المحدودة ليست سوى البداية.
المصدر المفتوح يحفز الابتكار
من خلال تبني فلسفة الابتكار المفتوح الشديد، تتحدى الشركات التي تشارك حقًا في تطوير البرمجيات مفتوحة المصدر المفاهيم التقليدية للميزة التنافسية من خلال الاعتراف بأن لا توجد جميع الأكواد الجيدة أو الأفكار العظيمة داخل مؤسستهم ويدعم هذا التحول دعوى أن الابتكارات المشتركة داخل النظام البيئي مفتوح المصدر تؤدي إلى نمو أسرع للسوق، مما يوفر حتى للشركات البرمجية الأصغر حجمًا أموالًا أكثر محدودية للبحث والتطوير. فرصة الاستفادة من الآثار الجانبية للبحث والتطوير الموجودة في البرمجيات مفتوحة المصدر. وذلك لأن الابتكار المفتوح، على النقيض من الاستعانة بمصادر خارجية تقليدية، يعزز الموارد الداخلية من خلال الاستفادة من الذكاء الجماعي للمجتمع، دون التقليل من جهود البحث والتطوير الداخلية. وهذا يعني أن شركات البرمجيات مفتوحة المصدر لا تضطر إلى التضحية بميزانياتها لملاحقة الريادة الفكرية والترميز خارج مؤسستها.
بالإضافة إلى ذلك، تعمل شركات البرمجيات مفتوحة المصدر على تعزيز الابتكار بشكل استراتيجي من خلال إصدار الكود مبكرًا وفي كثير من الأحيان إننا ندرك الطبيعة التراكمية لعملية الابتكار في مجتمع البرمجيات. وكل هذا يعني أن العديد من الناس يدركون بالفعل حقيقة مفادها أن البرمجيات مفتوحة المصدر تعمل على دفع عجلة الابتكار.
يعزز المصدر المفتوح التعاون
خلال الشبكات في مجتمع البرمجيات مفتوحة المصدر، يتمكن رواد الأعمال من تحقيق أهداف قصيرة وطويلة الأجل. حيث تعمل أهداف الربح قصيرة الأجل على بناء الشركات، بينما تعمل أهداف الربح طويلة الأجل على دعمها. وفي الوقت نفسه، تعمل جهود الشبكات هذه على إدامة الشبكة نفسها - وتنميتها لصالح رائد الأعمال التالي. ومن المعروف أن منصات المصدر المفتوح توفر الوصول إلى الكود المصدر، مما يمكن المطورين من إنشاء ترقيات وإضافات وقطع أخرى من البرامج واستخدامها وفقًا لمتطلباتهم. وقد شهد هذا النوع المعين من التعاون طفرة مع التبني الواسع النطاق لـ Kubernetes من قبل مجتمع البرمجيات الأوسع. والآن أكثر من أي وقت مضى، تعمل التقنيات الحديثة معًا بأقل قدر من الاحتكاك ويمكن أن تكون معًا في دقائق في أي مكان تقريبًا.
وتعترف شركات التكنولوجيا الكبرى بهذا التعاون العميق المتأصل في مجتمع المصادر المفتوحة عندما تطلق بحرية الأطر والمكتبات واللغات التي أنشأتها للحفاظ على الأدوات الداخلية وتطويرها. ويؤدي القيام بذلك إلى تعميق مجموعة المطورين القادرين على العمل على منتجاتها ويبدأ في وضع المعايير لكيفية عمل التقنيات المماثلة. وتنقل نفس المقالة في مجلة أتلانتيك عن مؤسس ميتا مارك زوكربيرج قوله "لقد كان من المفيد للغاية بالنسبة لنا توفير ذلك لأن جميع أفضل المطورين في جميع أنحاء الصناعة يستخدمون الآن أدوات نستخدمها أيضًا داخليًا".
المصدر المفتوح يولد المصدر المفتوح
هذه هي العوامل التي تجعلنا نرى في كثير من الأحيان أوجه تآزر بين شركات البرمجيات مفتوحة المصدر. ستعمل شركات الذكاء الاصطناعي والتعلم الآلي مفتوحة المصدر بشكل طبيعي على تطوير حلول مع منتجات أخرى مفتوحة المصدر من المنتجات الأساسية مثل تخزين الكائنات إلى أدوات التصور. عندما تتقدم شركة مفتوحة المصدر، فإننا جميعًا نفعل ذلك. ربما يكون هذا النهج المتماسك والمختلط هو أفضل رهان لدينا لتطوير الذكاء الاصطناعي الذي يتبنى نهجًا يركز على الإنسان. ستدفع هذه القوى الطبيعية المتأصلة في حاجة السوق إلى الذكاء الاصطناعي مفتوح المصدر جنبًا إلى جنب مع صفات برمجيات المصدر المفتوح من الإبداع والتعاون إلى مجموعة بيانات الذكاء الاصطناعي مفتوحة المصدر.
يرجى الانضمام والمساهمة في هذه المحادثة ومجتمعنا عن طريق مراسلتنا عبر البريد الإلكتروني على مرحباً@min.io أو أرسل لنا رسالة على قناة Slack الخاصة بنا.