paint-brush
मालिकाना और ओपन सोर्स एआई के बीच लड़ाईद्वारा@juanfrank77
2,478 रीडिंग
2,478 रीडिंग

मालिकाना और ओपन सोर्स एआई के बीच लड़ाई

द्वारा Juan F. Gonzalez7m2023/11/03
Read on Terminal Reader

बहुत लंबा; पढ़ने के लिए

पिछले दशकों में वैज्ञानिक प्रगति कैसे विकसित हुई है, इस पर एक नज़र। हमारे समय के कुछ महानतम आविष्कारों के उत्प्रेरक के रूप में ओपन-सोर्स सॉफ़्टवेयर के बारे में बात करना। मालिकाना एआई सॉफ्टवेयर की वर्तमान प्रगति के साथ-साथ ओपन-सोर्स समुदाय ने एआई और एमएल में जो महान प्रगति हासिल की है उसका अवलोकन। अंत में, दोनों दृष्टिकोणों के फायदे और नुकसान को देखते हुए भविष्य पर एक नज़र डालें।
featured image - मालिकाना और ओपन सोर्स एआई के बीच लड़ाई
Juan F. Gonzalez HackerNoon profile picture
0-item


अपने आप को संभालो दोस्तों, AI दुनिया पर कब्ज़ा कर रहा है!


खैर, शायद यह अभी तक पूरी तरह से नहीं हुआ है। लेकिन फिर भी, आप पिछले 12 महीनों में इसके प्रभाव के स्तर से इनकार नहीं कर सकते।


इस सब में अजीब बात यह है कि एक अवधारणा और अध्ययन के क्षेत्र के रूप में " कृत्रिम बुद्धिमत्ता " उतनी नई नहीं है, लेकिन इस साल आए सभी चैटबॉट और एआई-संचालित टूल के साथ यह "नया" लगता है।


इससे भी अधिक महत्वपूर्ण तथ्य यह है कि पिछले साल इस समय तक, एकमात्र व्यापक रूप से ज्ञात AI उपकरण GPT-3 और उसके बाद ChatGPT था। लेकिन अब, आपको उपलब्ध सभी विभिन्न एआई टूल, चैटबॉट और एलएलएम को ट्रैक करने में कठिनाई हो सकती है।


ये सभी 2 श्रेणियों में आते हैं:


बंद स्रोत (जैसे ChatGPT और क्लाउड)


खुला स्रोत (जैसे फाल्कन या मिस्ट्रल)


और यहीं यह दिलचस्प हो जाता है।


मालिकाना एआई मॉडल जितने लोकप्रिय और अत्यधिक परिष्कृत हो सकते हैं, एआई क्षेत्र में लहरें पैदा करने वाले और अपने भार वर्ग से ऊपर जाने वाले ओपन सोर्स मॉडल भी मौजूद हैं।


इस लेख में हम यही देखेंगे। एआई जैसी क्रांतिकारी तकनीक के साथ, क्या स्वामित्व वाली, ब्लैक-बॉक्स जैसी, सॉफ्टवेयर ही रास्ता है, या ओपन सोर्स एक बेहतर विकल्प है?


यह और अन्य सवालों के जवाब आज के एपिसोड में दिए जाएंगे.


खुला या बंद? वही वह सवाल है

आरंभ करने के लिए, पूरी वैज्ञानिक प्रक्रिया ईमानदारी, सत्यनिष्ठा और पारदर्शिता के सिद्धांतों पर बनाई गई है। इसमें निष्कर्षों को मान्य करने के लिए खुलापन, सहयोग और सहकर्मी समीक्षाएं शामिल हैं।


दुनिया की कई सबसे बड़ी वैज्ञानिक प्रगति, जैसे पाश्चुरीकरण, पेनिसिलिन और उर्वरक, वर्षों से कई वैज्ञानिकों के सहयोगात्मक कार्य के कारण संभव हो सकीं।


अक्सर, वे एक बड़ी समस्या से निपटते थे जहां उस समय उनके पास संसाधनों की कमी होती थी। उन्होंने अपने निष्कर्ष प्रकाशित किए और वैज्ञानिकों ने कई वर्षों बाद मानव जाति के लाभ के लिए मूल समस्या का समाधान विकसित करने के लिए इसे आधार के रूप में इस्तेमाल किया।


और यह ओपन-सोर्स तकनीक पर भी लागू होता है। दुनिया तब बदल गई जब कंप्यूटर पूरे कमरे को घेरने वाली विशाल मशीनों से ऐसे उपकरणों में बदल गए जो हर घर में हो सकते हैं।


और उसके बाद इंटरनेट आया जो कुछ विशेषाधिकार प्राप्त लोगों के बजाय कई लोगों को प्रौद्योगिकी तक पहुंच प्रदान करने की दिशा में एक और कदम था।


टिम बर्नर्स-ली ने 1989 में वर्ल्ड वाइड वेब का आविष्कार किया और इसे बिना किसी पेटेंट या रॉयल्टी के सभी के लिए स्वतंत्र रूप से उपलब्ध कराया। इससे इंटरनेट के तेजी से विकास और अगले दशक में आए कई नवाचारों को बढ़ावा मिला।


ऐसी ही कहानी ऑपरेटिंग सिस्टम के साथ होती है, विंडोज़ बनाम लिनक्स के बारे में सोचें। और वेब प्रौद्योगिकियों के साथ भी ऐसा ही हुआ है।


इन सभी पिछले उदाहरणों के साथ, यह तर्कसंगत है कि एआई जैसी परिवर्तनकारी तकनीक एक समान पथ का अनुसरण कर सकती है (या होनी चाहिए)।


तो, आइए देखें कि इस वर्ष दोनों पक्षों (क्लोज्ड और ओपन-सोर्स एआई) ने कैसे प्रगति की है।


मालिकाना एआई का राज्य

अब तक, यह किसी के लिए कोई खबर नहीं है कि चैटजीपीटी ने पिछले नवंबर में रिलीज़ होने पर कितना प्रभाव डाला था। और शेष वर्ष के लिए, मालिकाना AI शहर में चर्चा का विषय बन गया।


मार्च 2023 में, GPT-3 का उत्तराधिकारी, GPT-4 जारी किया गया। उस घटना ने एआई दौड़ को बढ़ावा दिया।


जल्द ही, Google बार्ड के साथ मैदान में शामिल हो गया। इसके बाद पूर्व ओपनएआई शोधकर्ताओं द्वारा स्थापित एंथ्रोपिक आया, जिसने लोकप्रिय चैटजीपीटी के दावेदार क्लाउड को रिलीज़ किया।


फिलहाल, OpenAI बाज़ार में सबसे अधिक "हिट" वाली कंपनी है।


वे हैं GPT मॉडल, विभिन्न Dall-E संस्करण और व्हिस्पर। माइक्रोसॉफ्ट अपने नए और बेहतर बिंग चैट (जो ओपनएआई की तकनीक पर आधारित है) और जल्द ही हर जगह शामिल होने वाला कोपायलट के साथ भी वहां मौजूद है।


Google प्रारंभिक अनुसंधान परियोजना बार्ड के साथ दौड़ में शामिल हो गया, जिसने शुरुआत में सभी को आश्चर्यचकित कर दिया और हमें Microsoft और इसकी पहलों पर अधिक ध्यान देने के लिए प्रेरित किया। लेकिन उस "विज्ञान मेला" परियोजना के बाद, Google ने अपने खेल को आगे बढ़ाया और वर्टेक्स एआई, PaLM (और PaLM2), इमेजेन और कोडी जैसी पेशकशें जारी कीं।


और फिर एंथ्रोपिक अपने शक्तिशाली क्लाउड (क्लाउड-इंस्टेंट, क्लाउड 2) के विभिन्न संस्करणों के साथ है। दिलचस्प बात यह है कि उन्होंने क्लाउड को प्रशिक्षित करने के लिए जिस दृष्टिकोण का उपयोग किया है, जिसे वे "संवैधानिक एआई" कहते हैं। यह दृष्टिकोण सुरक्षा को सबसे आगे रखता है और एआई बनाने में मदद करता है जो मानवीय हितों और मूल्यों के अनुरूप है।


वे एआई क्षेत्र में महान प्रगति हैं जो इस तथ्य के कारण अधिक व्यापक रूप से ज्ञात हैं कि वे उन कंपनियों द्वारा विकसित किए गए हैं जिनके पास कई कर्मचारी, व्यापक संसाधन और महान विपणन विभाग हैं।


अब आइए सिक्के के दूसरे पहलू पर नजर डालें।


ओपन सोर्स एआई का राज्य

GPT-4 के जारी होने के बाद से, न केवल तकनीकी दिग्गज एआई दौड़ में भाग लेने के लिए कूद पड़े हैं, बल्कि अन्य स्वतंत्र परियोजनाएं भी सामने आई हैं। TensorFlow और PyTorch जैसे ओपन-सोर्स ML फ्रेमवर्क द्वारा संभव बनाया गया।


स्टेबिलिटी एआई ने डैल-ई का एक विकल्प, स्टेबल डिफ्यूजन जारी किया है, और कई तकनीकी उत्साही लोगों ने इसकी क्षमताओं के साथ इस हद तक बड़े पैमाने पर प्रयोग किया है कि इसने कला और रचनात्मकता की प्रकृति के संबंध में नैतिक चिंताओं को सामने लाया है।


मेटा ने LLaMA (कई मॉडल आकारों और फिर दूसरे संस्करण के साथ) नामक एक अर्ध-खुले बड़े भाषा मॉडल को जारी करने की घोषणा की।


उस मॉडल ने हगिंग फेस सेवाओं (जैसे ग्रैडियो, स्पेसेस, ट्रांसफॉर्मर्स) के साथ एक क्रांति ला दी क्योंकि पहली बार, दुनिया भर के लोगों के पास ओपन-सोर्स तकनीक तक पहुंच थी जिसने चैटजीपीटी या पीएएलएम जैसी कंपनियों को टक्कर दी।


और क्या आप जानते हैं कि क्या होता है जब तकनीकी विशेषज्ञों, हैकरों और तकनीकी उत्साही लोगों के समूह के पास पर्याप्त समय और संसाधन होते हैं? हाँ, वे सामान बनाने में पागल हो सकते हैं।


इंटरनेट के आगमन के साथ 90 के दशक के विशिष्ट इंटरनेट मंचों और आईआरसी चैनलों को हगिंग फेस चर्चाओं, गिटहब मुद्दों और डिस्कोर्ड सर्वर से बदल दिया गया।


कुछ और जिसने ओपन-सोर्स विकास में योगदान दिया वह EleutherAI का पाइल डेटासेट था। इस पहल ने बड़े लेबल वाले डेटासेट की आवश्यकता को कम करते हुए, बिना पर्यवेक्षित और स्व-पर्यवेक्षित शिक्षण को आगे बढ़ाने में मदद की।



बड़े भाषा मॉडल, उन्हें प्रशिक्षित/सुसंगत करने के लिए डेटासेट और कंप्यूटिंग के लिए कम आवश्यकताओं के साथ, उत्पादों और सेवाओं का एक पूरा पारिस्थितिकी तंत्र जल्द ही उभरा।


(जब मैं कंप्यूटिंग के लिए कम आवश्यकताओं की बात करता हूं, तो मेरा मतलब है कि एलएलएम को मालिकाना मॉडल द्वारा उत्पन्न परिणामों की गुणवत्ता का उत्पादन करने के लिए एक टन मापदंडों की आवश्यकता नहीं है, यह एलएलएएमए 13बी और मिस्ट्रल 7बी जैसे मॉडलों द्वारा दिखाया गया है)


इस क्षेत्र में ढेर सारी परियोजनाएं, पूर्व-प्रशिक्षित और बेहतर ट्यून किए गए मॉडल, डेटासेट और उपकरण उन सभी के लिए उपलब्ध हैं जो इसमें शामिल होना चाहते हैं और दूसरों के साथ सहयोग करना चाहते हैं।


अब हमारे पास विभिन्न प्रकार के चैटबॉट हैं जो ज़ेफिर-चैट, एलएलएएमए2-चैट, मिस्ट्रल-इंस्ट्रक्ट और फाल्कन-चैट जैसे काम करने के लिए जीपीटी-3/जीपीटी-4 पर निर्भर नहीं हैं।


एलएलएम को कोड जनरेशन और कोड-एलएलएएमए , कोडजेन और स्टारकोडर जैसी सहायता के लिए ठीक किया गया है।


ब्लूम नामक एक ओपन-एक्सेस बहुभाषी भाषा मॉडल।


मल्टीमॉडल एलएलएम (जो सिर्फ टेक्स्ट नहीं हैं) जैसे एलएलएवीए और फ़्यूयू


एक हगिंग फेस लीडरबोर्ड जो सभी मौजूदा ओपन-सोर्स मॉडल का मूल्यांकन और रैंक करता है।


RedPajama या OpenOrca जैसे एलएलएम को प्री-ट्रेनिंग और फाइन-ट्यूनिंग के लिए कई डेटासेट।


और हाल ही में हमारे पास अधिक स्वायत्त मॉडल हैं जिन्हें "एआई एजेंट" कहा जाता है।


सबसे लोकप्रिय GPT-3.5 द्वारा संचालित हैं लेकिन LLaMA पर आधारित अन्य भी हैं।


और ऐसा लगता है कि हम ऐसे एजेंट बनाने की होड़ में हैं जो लूप में न फंसें या स्वतंत्र रूप से कार्यों को पूरा कर सकें, बिना बहुत सारे पाठों के, जो ठोस लगते हैं लेकिन या तो गलत हैं या बिल्कुल गलत हैं।


पिछले 6 महीनों में ही काफी प्रगति हुई है और आप निश्चिंत हो सकते हैं कि कोई भी मोर्चा धीमा होने के संकेत नहीं दे रहा है।

आगे जा रहा है

यहां तक कि पिछले वर्ष में हमने जो भी आश्चर्यजनक, तेज गति वाली प्रगति देखी है, उसके बावजूद भी हम एआई के विकास में अभी भी शुरुआती स्तर पर हैं। ऐसी कई चीजें हैं जिनका हमें पता लगाने की जरूरत है, एआई गोपनीयता, नैतिकता, अंतर्निहित पूर्वाग्रह इत्यादि जैसे विभिन्न पहलुओं पर विचार करना होगा।


जीवन में हर चीज़ की तरह, कोई भी एक पक्ष पूरी तरह से गलत नहीं है और दूसरा सही है। मालिकाना और ओपन-सोर्स एआई दोनों के अपने फायदे और नुकसान हैं।


मालिकाना एआई व्यापक पैमाने पर लोगों तक पहुंच प्रदान करते हुए नए और अधिक शक्तिशाली मॉडल को प्रशिक्षित करने के लिए अधिक मात्रा में संसाधनों का लाभ उठा सकता है। लेकिन वे एक ब्लैक बॉक्स की तरह काम करते हैं, उनमें अवलोकन क्षमता की कमी होती है, और उनके हित नियमित उपभोक्ता की तुलना में पैसे वाले बड़े खिलाड़ियों से अधिक जुड़े हो सकते हैं।


दूसरी ओर, ओपन-सोर्स एआई, विश्वव्यापी सहयोग, पारदर्शिता और खुले नवाचार से लाभान्वित होता है। लेकिन इसमें अधिक महत्वाकांक्षी पहलों के लिए संगठन, संसाधनों का अभाव है, और यदि कड़े नियम स्थापित किए जाते हैं तो यह जोखिम में है।


अब सवाल यह है कि हम एआई में प्रगति को हाइब्रिड तरीके से कैसे जारी रख सकते हैं।


एक तरीका जिससे हम इस क्षेत्र के कुछ प्रतिभाशाली दिमागों और आवश्यक संसाधनों के साथ संयुक्त रूप से सहयोग कर सकते हैं ताकि इस नवाचार को एक जिम्मेदार तरीके से आगे बढ़ाया जा सके जो सुरक्षा और गोपनीयता को सबसे आगे रखता है।


एक ऐसा तरीका जिसमें कुछ लोगों के हित और लाभ हममें से बाकी लोगों के हितों पर भारी नहीं पड़ते। एक ऐसा तरीका जिसमें एआई जैसी क्रांतिकारी तकनीक का निजीकरण, प्रतिबंधित या बड़ी शक्तियों के "दुश्मन" समझे जाने वाले लोगों के समूहों के खिलाफ हथियार नहीं बनाया जाता है।


हम इतिहास के एक अनूठे क्षण में हैं जहां हम जो निर्णय लेते हैं और जिस तरह से हम प्रौद्योगिकी को संभालते हैं वह यह निर्धारित करेगा कि भविष्य कैसे आकार लेगा, बेहतर या बदतर के लिए।


पढ़ने के लिए धन्यवाद।


करना न भूलें हैकरनून पर सदस्यता लें और आने वाले लेखों को न चूकें।