एउटा भविष्यको कल्पना गर्नुहोस् जहाँ AI कर्पोरेट भल्टहरूमा बन्द गरिएको छैन, तर नयाँ आविष्कारहरूको विश्वव्यापी समुदायद्वारा खुला ठाउँमा, इट्टाले इट्टाले निर्माण गरिएको छ। जहाँ सहकार्य, प्रतिस्पर्धा होइन, इन्धनको उन्नति, र नैतिक विचारहरूले कच्चा कार्यसम्पादनसँग समान वजन राख्छ। यो विज्ञान कथा होइन, यो AI विकासको मुटुमा हुने खुला स्रोत क्रान्ति हो। तर बिग टेकको आफ्नै एजेन्डा छ, प्रतिबन्धित मोडेलहरूलाई खुला स्रोतको रूपमा मास्किङ गर्दा साँच्चै खुला समुदायको फाइदा उठाउने प्रयास गर्दै।
संहिताका तहहरू पछ्याऔं र यी प्रयासहरू पछाडिको सत्यताको पर्दाफास गरौं। खुला-स्रोत AI को भविष्यको यो अन्वेषणले AI विकासमा "वास्तविकहरू" लाई विच्छेदन गर्नेछ र इनोभेसन इन्जिनलाई उजागर गर्नका लागि "वास्तविकहरू" लाई च्याम्पियन बनाउँदछ जुन खुला स्रोत सफ्टवेयर सबैको मुनि गुनगुनाइरहेको छ। तल्लो रेखा यो हो कि खुला स्रोत AI ले खुला स्रोत डाटा स्ट्याक जन्माउनेछ।
आवश्यकता
एट्लान्टिक मा Matteo Wong द्वारा एक भर्खरको लेख, ' 'ओपन' एआई जस्तो चीज कहिल्यै थिएन ' साँच्चै खुला स्रोत AI को लागी एकेडेमिया र सफ्टवेयर समुदायमा बढ्दो प्रवृत्तिको वर्णन गर्दछ। "विचार अपेक्षाकृत पारदर्शी मोडेलहरू सिर्जना गर्ने हो जुन जनताले अझ सजिलै र सस्तो रूपमा प्रयोग गर्न, अध्ययन गर्न र पुन: उत्पादन गर्न सक्ने, काम, प्रहरी, मनोरञ्जन र धर्मलाई पनि रूपान्तरण गर्ने क्षमता हुन सक्ने उच्च केन्द्रित प्रविधिलाई प्रजातन्त्रीकरण गर्ने प्रयास गर्दै।" त्यही एट्लान्टिकले सुझाव दिन्छ कि मेटा जस्ता ठूला टेक कम्पनीहरूले आफ्ना उत्पादनहरू 'खुला-धुने' गरेर बजारमा यो आवश्यकता पूरा गर्न खोजिरहेका छन्। तिनीहरूले उनीहरूको उत्पादनलाई साँच्चै खुला-सोर्सिङ नगरी खुला-स्रोत समुदायको गुणहरू र सकारात्मक प्रतिष्ठा ग्रहण गरिरहेका छन्। तर, वास्तविक कुराको विकल्प छैन। यो किनभने साँचो खुला स्रोत सफ्टवेयरले नवीनता र सहयोगलाई ड्राइभ गर्दछ: दुई गुणहरू जुन एआईसँग जिम्मेवारीपूर्वक अगाडि बढ्नको लागि अत्यन्तै आवश्यक छ।
ढोंग गर्नेहरू
LLaMA 2, मेटा द्वारा सिर्जना गरिएको एक ठूलो भाषा मोडेल हो जुन अनुसन्धान र व्यावसायिक प्रयोग दुवैको लागि प्रयोग गर्न निःशुल्क छ। LLaMA 2 खुला स्रोत हो भनेर सुझाव दिन केहीलाई नेतृत्व गर्दै। यद्यपि, मेटाले उनीहरूको मोडेलको प्रयोगमा केही गम्भीर प्रतिबन्धहरू लागू गरेको छ। उदाहरणका लागि, LLaMA 2 अन्य कुनै ठूलो भाषा मोडेल सुधार गर्न प्रयोग गर्न सकिँदैन। परम्परागत विपरित जान्छ निजी सामूहिक नवाचार मोडेल खुला सफ्टवेयर जसले सफ्टवेयर समुदायमा सबैको फाइदाको लागि नवीनताको स्वतन्त्र र खुला खुलासालाई बढावा दिन्छ।
मेटाले 700 मिलियन मासिक प्रयोगकर्ताहरू भएका उत्पादनहरूसँग LLaMA 2 को एकीकरणलाई अनुमति नदिई र तिनीहरूको मोडेललाई कुन डेटामा तालिम दिइएको छ वा तिनीहरूले यसलाई निर्माण गर्न प्रयोग गरेको कोड खुलासा नगरेर तिनीहरूको मोडेलको प्रयोगलाई थप अपांग बनायो। खुलासा नगरेर, मेटाले आफैंलाई अन्तर्निहित पूर्वाग्रह र आकस्मिक भेदभावका प्रश्नहरूमा खोल्दै छ। भेदभावपूर्ण डेटामा प्रशिक्षित मोडेल हुनेछ भेदभावपूर्ण प्रतिक्रियाहरू प्रदान गर्नुहोस् । सफ्टवेयर समुदायले ठूलो मात्रामा मोडेल निर्माण गर्न प्रयोग गरिएको कोड हेर्न सक्षम भएन भने कुनै सुरक्षात्मक उपायहरू निर्माण गरिएको छ वा यसलाई तालिम दिन प्रयोग गरिएको डाटा, हामी यी नैतिक प्रश्नहरूमा अन्धकारमा छोडिएका छौं। एक समयमा जब AI मा अनुसन्धान प्रकाशित न्याय भन्दा कार्यसम्पादनमा बढी चिन्तित छ र यो अस्पष्टतालाई सम्मान गर्न विशेष गरी चिन्ताजनक छ।
वास्तविक व्यक्तिहरू
Mistral AI यसको खुला-स्रोत ठूला भाषा मोडेलहरूको लागि मान्यता प्राप्त गरेको छ, विशेष गरी Mistral 7B र Mixtral 8x7B। कम्पनीले आफ्ना AI मोडेलहरूमा व्यापक पहुँच सुनिश्चित गर्न प्रयास गर्छ, समीक्षा, परिमार्जन, र खुला सफ्टवेयर समुदायद्वारा पुन: प्रयोग गर्न प्रोत्साहन दिन्छ।
vLLM "भेक्टोराइज्ड कम-लेटेन्सी मोडेल सर्भिङ" को लागि खडा छ र एक खुला स्रोत पुस्तकालय हो जुन विशेष गरी ठूला भाषा मोडेलहरू (LLMs) को गति बढाउन र अनुकूलन गर्न डिजाइन गरिएको हो। यो एक शक्तिशाली उपकरण हो जसले LLM को प्रदर्शन र उपयोगितामा उल्लेखनीय सुधार गर्न सक्छ। यसले च्याटबटहरू र भर्चुअल सहायकहरूदेखि लिएर सामग्री निर्माण र कोड उत्पादनसम्म विभिन्न प्रकारका AI अनुप्रयोगहरूमा काम गर्ने विकासकर्ताहरूका लागि यसलाई बहुमूल्य सम्पत्ति बनाउँछ। यति धेरै, मिस्ट्रलले 7B र 8x7B मोडेलहरूको लागि अनुमान सर्भरको रूपमा vLLM प्रयोग गर्न सिफारिस गर्दछ।
EleutherAI एक गैर-लाभकारी AI अनुसन्धान प्रयोगशाला हो जुन एक अग्रणी गैर-नाफामुखी अनुसन्धान संस्थामा GPT-3 छलफल गर्न Discord सर्भरबाट बढेको छ। यो समूह प्राकृतिक भाषा प्रशोधनमा खुला विज्ञान मानदण्डहरूलाई प्रशिक्षण र प्रवर्द्धन गर्ने कामका लागि परिचित छ। तिनीहरूले विभिन्न खुला स्रोत ठूला भाषा मोडेलहरू जारी गरेका छन् र AI पङ्क्तिबद्धता र व्याख्यातासँग सम्बन्धित अनुसन्धान परियोजनाहरूमा संलग्न छन्। तिनीहरूको LM-हार्नेस परियोजना सम्भवतः भाषा मोडेलहरूको लागि अग्रणी खुला स्रोत मूल्याङ्कन उपकरण हो।
फि-२ माइक्रोसफ्टको एलएलएम हो जसले आफ्नो वजनभन्दा माथि छक्क पार्छ। सिंथेटिक पाठहरू र फिल्टर गरिएका वेबसाइटहरूको मिश्रणमा प्रशिक्षित, यो सानो, तर शक्तिशाली मोडेलले प्रश्न-उत्तर, सारांश, र अनुवाद जस्ता कार्यहरूमा उत्कृष्ट प्रदर्शन गर्दछ। Phi-2 लाई वास्तवमै अलग गर्ने कुरा भनेको तर्क र भाषा बुझाइमा यसको फोकस हो, जसले उन्नत पङ्क्तिबद्ध प्रविधिहरू बिना पनि प्रभावशाली प्रदर्शन गर्न अग्रसर गर्दछ।
धेरै सक्षम खुला स्रोत इम्बेडिङ मोडेलहरूले समग्र खुला स्रोत जेनेरेटिभ एआई स्पेसलाई बलियो बनाउँदैछन्। यी खुला स्रोतका लागि हालको अत्याधुनिक हुन् र समावेश छन् UAE-Large-V1 र बहुभाषी-e5-ठूलो ।
यो निरन्तर बढ्दो क्षेत्रमा धेरै छन्। यो सीमित सूची एउटा सुरुवात मात्र हो।
खुला स्रोत ड्राइव नवाचार
चरम खुला आविष्कारको दर्शनलाई अँगालेर, खुला स्रोत सफ्टवेयर विकासमा साँच्चै भाग लिने कम्पनीहरूले प्रतिस्पर्धी फाइदाको परम्परागत धारणाहरूलाई स्वीकार गरेर चुनौती दिन्छन्। सबै राम्रो कोड वा महान विचारहरू तिनीहरूको संगठन भित्र बस्दैनन् । यो परिवर्तनले समर्थन गर्दछ तर्क खुला-स्रोत इकोसिस्टम भित्रको आविष्कारहरू साझा गर्नाले बजारको तीव्र बृद्धिको लागि नेतृत्व गर्दछ, अझ साना सफ्टवेयर फर्महरूलाई थप सीमित R&D कोषहरू प्रदान गर्दछ। लाभ उठाउने अवसर खुला स्रोत सफ्टवेयरमा उपस्थित R&D spillovers बाट। यो किनभने, परम्परागत आउटसोर्सिङको विपरीत, खुला नवीनता आन्तरिक स्रोतहरू बढाउँछ आन्तरिक अनुसन्धान र विकास प्रयासहरूलाई कम नगरी समुदायको सामूहिक बुद्धिमत्ताको लाभ उठाएर। यसको मतलब खुला स्रोत सफ्टवेयर कम्पनीहरूले आफ्नो संगठन बाहिर विचार नेतृत्व र कोड पछ्याउन आफ्नो बजेट त्याग गर्नु पर्दैन।
थप रूपमा, खुला स्रोत सफ्टवेयर कम्पनीहरूले रणनीतिक रूपमा नवाचार चलाउँछन् कोड प्रारम्भिक र अक्सर जारी गर्दै , सफ्टवेयर समुदायमा नवीनता प्रक्रियाको संचयी प्रकृति पहिचान गर्दै। जुन सबैले केहि भन्नको लागि धेरैले पहिले नै चिन्छन्: ओपन सोर्स सफ्टवेयरले नवीनतालाई ड्राइभ गर्दछ।
खुला स्रोत फोस्टर्स सहयोग
मार्फत नेटवर्किङ खुला स्रोत सफ्टवेयर समुदायमा, उद्यमीहरूले छोटो अवधि र दीर्घकालीन दुवै लक्ष्यहरू पूरा गर्न सक्षम छन्। छोटो अवधिको नाफा लक्ष्यहरूले कम्पनीहरू निर्माण गर्छन् र दीर्घकालीन लाभ लक्ष्यहरूले उनीहरूलाई कायम राख्छन्। एकै समयमा, यो नेटवर्किङ प्रयासले नेटवर्कलाई आफैंलाई स्थायी बनाउँछ - अर्को उद्यमीका लागि यसलाई बढाउँदै। यो राम्रोसँग थाहा छ कि खुला-स्रोत प्लेटफर्महरूले स्रोत कोडमा पहुँच प्रदान गर्दछ, विकासकर्ताहरूलाई अपग्रेडहरू, प्लग-इनहरू र सफ्टवेयरका अन्य टुक्राहरू सिर्जना गर्न र उनीहरूको आवश्यकता अनुसार प्रयोग गर्न सक्षम पार्छ। यस विशेष प्रकारको सहकार्यले फराकिलो सफ्टवेयर समुदायद्वारा कुबेरनेटलाई व्यापक रूपमा अपनाएर बूम अनुभव गरेको छ। अब पहिले भन्दा बढि, आधुनिक प्रविधिहरूले धेरै थोरै घर्षणको साथ सँगै काम गर्दछ र मिनेटमा लगभग कहीं पनि सँगै हुन सक्छ।
ठूला टेक कम्पनीहरूले खुला-स्रोत समुदायमा निहित यस गहिरो सहयोगलाई स्वीकार गर्छन् जब उनीहरूले स्वतन्त्र रूपमा फ्रेमवर्कहरू, पुस्तकालयहरू, र भाषाहरू जारी गर्छन् जुन तिनीहरूले आन्तरिक उपकरणहरू कायम राख्न र विकास गर्न सिर्जना गर्छन्। त्यसो गर्नाले विकासकर्ताहरूको पोखरीलाई उनीहरूको उत्पादनहरूमा काम गर्न सक्षम बनाउँछ र समान प्रविधिहरू कसरी सञ्चालन गर्नुपर्छ भनेर मानक सेट गर्न थाल्छ। त्यही एट्लान्टिक लेखले मेटाका संस्थापक मार्क जुकरबर्गको भनाइ उद्धृत गरेको छ "यो प्रदान गर्न हाम्रो लागि धेरै मूल्यवान भएको छ किनभने अब उद्योगका सबै उत्कृष्ट विकासकर्ताहरूले उपकरणहरू प्रयोग गरिरहेका छन् जुन हामीले आन्तरिक रूपमा पनि प्रयोग गरिरहेका छौं"।
खुला स्रोत खुला स्रोत जन्माउँछ
यी कारकहरू हुन् किन हामी प्रायः खुला स्रोत कम्पनीहरू बीच तालमेल देख्छौं। खुला स्रोत AI र ML कम्पनीहरूले स्वाभाविक रूपमा अन्य खुला स्रोत उत्पादनहरू जस्तै वस्तु भण्डारणदेखि लिएर भिजुअलाइजेसन उपकरणहरूमा स्ट्याकसम्मका आधारभूत उत्पादनहरूसँग समाधानहरू विकास गर्नेछन्। जब एउटा खुला स्रोत कम्पनी अगाडि बढ्छ, हामी सबै गर्छौं। यो एकजुट र मिश्रित दृष्टिकोण मानव-केन्द्रित दृष्टिकोण लिने एआई विकास गर्नको लागि हाम्रो सबैभन्दा राम्रो शर्त हो। बजारमा अन्तर्निहित यी प्राकृतिक शक्तिहरूलाई खुला स्रोत AI को आवश्यकता छ र नयाँ आविष्कार र सहयोगको खुला स्रोत सफ्टवेयरको गुणहरूले AI डाटा स्ट्याक खुला स्रोतलाई ड्राइभ गर्नेछ।
कृपया हामीलाई इमेल गरेर यो कुराकानी र हाम्रो समुदायमा सामेल हुनुहोस् र योगदान गर्नुहोस् [email protected] वा हामीलाई हाम्रो Slack च्यानलमा सन्देश पठाउँदै।