paint-brush
चैटजीपीटी के पीछे प्रौद्योगिकी और प्रशिक्षण रहस्य की खोजद्वारा@ILLA Cloud
1,087 रीडिंग
1,087 रीडिंग

चैटजीपीटी के पीछे प्रौद्योगिकी और प्रशिक्षण रहस्य की खोज

द्वारा ILLA Cloud7m2023/04/24
Read on Terminal Reader

बहुत लंबा; पढ़ने के लिए

चैटजीपीटी ने अपने उल्लेखनीय संवादी कौशल के कारण अपार लोकप्रियता हासिल की है। इसमें कई प्रकार की क्षमताएं हैं, जिसमें खेल खेलने, कविता और लिपियों की रचना करने की क्षमता शामिल है। ChatGPT को नैतिक सिद्धांतों पर ध्यान केंद्रित करने के लिए प्रशिक्षित किया जाता है, जो इसे उन अनुरोधों या प्रश्नों को अस्वीकार करने की अनुमति देता है जो इसके पूर्व निर्धारित नैतिक दिशानिर्देशों का उल्लंघन करते हैं।
featured image - चैटजीपीटी के पीछे प्रौद्योगिकी और प्रशिक्षण रहस्य की खोज
ILLA Cloud HackerNoon profile picture
0-item

चैटजीपीटी ने अपने उल्लेखनीय संवादी कौशल के कारण अपार लोकप्रियता हासिल की है। इसमें गेम खेलने, कविता और स्क्रिप्ट लिखने, प्रोग्राम डिबगिंग में सहायता करने, वेबसाइट डिज़ाइन बनाने और एआईजीसी संकेत उत्पन्न करने की क्षमता सहित क्षमताओं की एक विस्तृत श्रृंखला है। ट्विटर पर इसकी क्षमताओं के कई उदाहरण मिल सकते हैं, जैसा कि बेन टॉसेल द्वारा संकलित किया गया है।


वास्तव में, चैटजीपीटी को हाल ही में एक एमबीए प्रोफेसर ने उनके प्रबंधन के सवालों के जवाब देने के लिए कहा था, जिससे यह निष्कर्ष निकला कि उन्हें अब घर ले जाने वाला होमवर्क नहीं देना चाहिए। यह स्पष्ट है कि बहुत से लोगों को एक बार शुरू करने के बाद चैटजीपीटी का उपयोग बंद करना मुश्किल हो गया है।

चैटजीपीटी

Chatgpt को बेहतर बनाने के तरीके

अपने पूर्ववर्ती GPT-3 की तुलना में, ChatGPT का प्रमुख सुधार पिछले वार्तालाप डेटा को बनाए रखने की क्षमता है, जो उपयोगकर्ताओं को विस्तारित संवादों के दौरान एक सहज अनुभव प्रदान करता है।


चैटजीपीटी अपनी गलतियों को स्वीकार करने और सुधारने में सक्षम है। यदि आपको उसकी प्रतिक्रिया असंतोषजनक लगती है, तो आप उसे अपने उत्तर को संशोधित करने और बेहतर समाधान पेश करने के लिए कह सकते हैं।


ChatGPT में त्रुटिपूर्ण धारणाओं पर सवाल उठाने और उन्हें चुनौती देने की क्षमता है। GPT-3 के जारी होने के शुरुआती दिनों में, कई उपयोगकर्ताओं को एआई द्वारा झूठी सामग्री उत्पन्न करने के कारण नकारात्मक अनुभव हुए थे जो सुनने में विश्वसनीय लगते थे लेकिन वास्तविकता पर आधारित नहीं थे। हालाँकि, यदि आप चैटजीपीटी से एक प्रश्न पूछते हैं जैसे "2015 में अमेरिका में कोलंबस क्या कर रहा था?" यह पहचान लेगा कि उस समय कोलंबस मौजूद नहीं था।


इसके अलावा, चैटजीपीटी को नैतिक सिद्धांतों पर ध्यान केंद्रित करने के लिए प्रशिक्षित किया जाता है, जो इसके पूर्व निर्धारित नैतिक दिशानिर्देशों का उल्लंघन करने वाले अनुरोधों या प्रश्नों को अस्वीकार करने की अनुमति देता है। फिर भी, OpenAI की सावधानी के बावजूद, चतुर पूछताछ अभी भी इन दिशानिर्देशों को दरकिनार करने की अनुमति दे सकती है।

चैटजीपीटी के प्रशिक्षण के तरीके

ChatGPT द्वारा नियोजित प्रशिक्षण पद्धति बड़े पैमाने के मॉडल के लिए उपयोग किए जाने वाले "प्री-ट्रेनिंग-फाइन-ट्यूनिंग" के पारंपरिक दृष्टिकोण का अनुसरण करती है। मॉडल को पहले एक व्यापक सार्वजनिक डेटासेट पर प्रशिक्षित किया जाता है और फिर वांछित प्रदर्शन प्राप्त करने के लिए एक छोटे डेटासेट के साथ फ़ाइन-ट्यूनिंग द्वारा विशिष्ट एप्लिकेशन डोमेन (जैसे मानव जैसी बातचीत) के लिए अनुकूलित किया जाता है। फाइन-ट्यूनिंग, संकेत और अन्य तकनीकें मॉडल के मूल को महत्वपूर्ण रूप से संशोधित नहीं करती हैं, लेकिन वे इसके व्यावहारिक प्रदर्शन को महत्वपूर्ण रूप से बढ़ा सकती हैं। हालांकि, GPT-3 की मानव प्रश्नों को समझने की क्षमता सबसे स्वाभाविक नहीं है, और या तो कार्य को पुनर्गठित करने की आवश्यकता है या कार्य से मेल खाने के लिए मॉडल को ठीक-ठीक किया गया है, जिससे दक्षता में सुधार हुआ है।


ChatGPT, InstructGPT का एक सहोदर मॉडल है, जिसे जनवरी 2022 में जारी किया गया था। InstructGPT में मॉडल के आउटपुट के मानव प्रदर्शन शामिल हैं और प्रशिक्षण के परिणामों को क्रमबद्ध करते हैं, जिससे यह GPT-3 की तुलना में मानव निर्देशों का पालन करने के लिए अधिक उपयुक्त हो जाता है। चैटजीपीटी की नवीन प्रशिक्षण पद्धति को "मानव प्रतिक्रिया से सुदृढीकरण सीखना" (आरएलएचएफ) के रूप में जाना जाता है।


ChatGPT GPT-3.5 मॉडल पर बनाता है, प्रशिक्षण के लिए पाठ और कोड डेटासेट का लाभ उठाता है, और इस उद्देश्य के लिए Microsoft के Azure AI सर्वर का उपयोग करता है। मूल GPT-3 प्रशिक्षण डेटासेट में केवल पाठ शामिल था, इसलिए इस नए संस्करण में कोड को समझने और बनाने की अतिरिक्त क्षमता है।

जीपीटी3.5

चैटजीपीटी ने इतना महत्वपूर्ण सुधार क्यों दिखाया है?

स्मृति रखने और संदर्भ के साथ निरंतर संवाद में संलग्न होने की क्षमता के अलावा, चैटजीपीटी के लिए उपयोग की जाने वाली प्रशिक्षण पद्धति भी उल्लेखनीय है। आरएलएचएफ पद्धति, जिसे पहली बार मार्च 2022 में एक शोध पत्र में पेश किया गया था, उद्योग की अटकलों के बावजूद इंस्ट्रक्शनजीपीटी के प्रशिक्षण के दौरान उपयोग नहीं किया गया था।


InstructGPT ने text-DaVinci-002 मॉडल को नियोजित किया, जिसमें मोड पतन जैसे मुद्दों का सामना करना पड़ा, जहां यह पूछे गए प्रश्न की परवाह किए बिना एक ही उत्तर में परिवर्तित हो गया। ChatGPT ने RLHF पद्धति के सफल अनुप्रयोग के साथ उल्लेखनीय परिणाम प्राप्त किए हैं। हालांकि, आरएलएचएफ को प्रशिक्षित करना आसान नहीं है, क्योंकि यह अक्सर विरल प्रतिक्रिया और मोड पतन जैसे मुद्दों का सामना करता है।


पेपर मार्च में प्रकाशित हुआ था, लेकिन चैटजीपीटी को लॉन्च करने में दिसंबर तक का समय लगा क्योंकि महत्वपूर्ण फाइन-ट्यूनिंग की आवश्यकता थी। इसके अतिरिक्त, निर्देश ट्यूनिंग ने ChatGPT के विकास में महत्वपूर्ण योगदान दिया है। InstructGPT में GPT-3 की तुलना में कम पैरामीटर हैं, फिर भी इसका आउटपुट GPT-3 और पर्यवेक्षित शिक्षण का उपयोग करके ठीक किए गए मॉडल दोनों से बेहतर है। इंस्ट्रक्शन ट्यूनिंग और प्रॉम्प्ट मेथड भाषा मॉडल के अंतर्निहित ज्ञान की खोज का एक समान कोर साझा करते हैं। हालाँकि, वे उस संकेत में भिन्न हैं जो भाषा मॉडल की पूर्णता क्षमता को उत्तेजित करता है, जबकि निर्देश ट्यूनिंग स्पष्ट निर्देश प्रदान करके भाषा मॉडल की समझने की क्षमता को उत्तेजित करता है।


अतीत में बड़े मॉडल खुद मॉडल पर ध्यान केंद्रित करते थे और इंजीनियरिंग को बढ़ावा देते थे, जबकि चैटजीपीटी का पुनरावृत्त ध्यान दाईं ओर बंद लूप पर होता है, जैसा कि नीचे दिए गए चित्र में दिखाया गया है।

चैटजीपीटी का पुनरावृत्त फोकस बंद लूप पर है

अंत में, चैटजीपीटी प्रभावी उत्तर प्रदान करने और झूठी सूचना से बचने के बीच एक अच्छा संतुलन बनाता है। यह मेटा के गैलेक्टिका मॉडल के विपरीत है जिसे बहुत अधिक गलत जानकारी प्रदान करने के कारण लॉन्च के तीन दिन बाद ही हटा दिया गया था।


इसका एक कारण मेटा का अति-प्रचारित विपणन था, जिसने उम्मीदों को बहुत अधिक बढ़ा दिया और अंततः चुनिंदा शोधकर्ताओं से निराशा हुई। हालाँकि, ChatGPT ने फाइन-ट्यूनिंग और शीघ्र इंजीनियरिंग का एक संपूर्ण काम किया है, जो स्व-विरोधाभासी प्रश्नों की पहचान करने में मदद करता है और उपयोगकर्ताओं को इसके उत्तरों की सटीकता में अधिक विश्वास दिलाता है, भले ही यह झूठी सूचना की समस्या को पूरी तरह से समाप्त नहीं कर सकता है।

व्यापार रणनीति महत्वपूर्ण है

GPT-3 के विपरीत, जो उपयोगकर्ताओं से उनके उपयोग के आधार पर शुल्क लेता था, ChatGPT वर्तमान में जनता के लिए मुफ्त और असीमित पहुंच के साथ उपलब्ध है। यह उपयोगकर्ताओं को मंच पर सभी प्रकार के विचित्र विचारों के साथ प्रयोग करने की अनुमति देता है। उपयोगकर्ताओं को फीडबैक प्रदान करने के लिए भी प्रोत्साहित किया जाता है, जो ओपनएआई के लिए अत्यधिक मूल्यवान है। हालाँकि OpenAI राजस्व उत्पन्न करने की जल्दी में नहीं है, न ही इसके पास धन की कमी है, अफवाहें बताती हैं कि इसका नवीनतम मूल्यांकन कई दसियों अरबों डॉलर तक पहुँच गया है, जिसमें Microsoft इसका मुख्य निवेशक है।


एआई के विकास में, इंजीनियरिंग का महत्व वास्तव में विज्ञान की तुलना में अधिक है, और पुनरावृत्त फीडबैक लूप बनाना महत्वपूर्ण है। OpenAI व्यावसायिक अनुप्रयोगों पर बहुत अधिक जोर देता है, और GPT-3 के पास पहले से ही बड़ी संख्या में ग्राहक हैं। OpenAI के साथ इन ग्राहकों की बातचीत और फीडबैक भी प्रगति के प्रमुख चालक हैं।


इसके विपरीत, Google का बंद दरवाज़ा दृष्टिकोण पुराना लगता है। शायद यह एक व्यावसायिक संस्कृति की कमी या इनपुट-आउटपुट अनुपात में सीमाओं के कारण है। बड़े मॉडलों के अनुप्रयोग में Google हमेशा "संयमित" रहा है, भले ही शुरुआती बिंदु उच्च हो। यदि यह स्वायत्त ड्राइविंग के लिए वेमो के दृष्टिकोण की तरह छोटे पैमाने पर पुनरावृति जारी रखता है, तो यह अंततः अधिक खुली और डेटा-समृद्ध कंपनियों द्वारा पार कर लिया जाएगा।

GPT-3 एंटरप्राइज़ ग्राहक

भविष्य में सुधार:

RLHF एक अपेक्षाकृत नई विधि है, और चूंकि OpenAI चैटजीपीटी से एकत्र की गई उपयोगकर्ता प्रतिक्रिया का पता लगाना और शामिल करना जारी रखता है, इसलिए मॉडल में और सुधार की गुंजाइश अभी भी है। विशेष रूप से, नैतिक/संरेखण के मुद्दों को संबोधित करना और सिस्टम की सीमाओं को दरकिनार करके उत्पन्न होने वाली नकारात्मक जानकारी को रोकना आवश्यक है, जैसा कि पिछले कुछ दिनों में उपयोगकर्ताओं द्वारा खोजा गया था।


इसके अतिरिक्त, यह ध्यान देने योग्य है कि OpenAI में WebGPT जैसे उपकरण भी हैं, जिन्हें एक उन्नत वेब क्रॉलर के रूप में समझा जा सकता है जो प्रश्नों के उत्तर देने और संबंधित स्रोत प्रदान करने के लिए इंटरनेट से जानकारी निकालता है। WebGPT उत्तर उत्पन्न करने के लिए GPT-3 की सिमेंटिक समझ क्षमता और इंटरनेट से सार्वजनिक जानकारी का उपयोग कर सकता है और यह एक उन्नत उन्नत खोज क्षमता है।


MIT टेक्नोलॉजी रिव्यू द्वारा आयोजित OpenAI वैज्ञानिकों के साथ एक साक्षात्कार के दौरान, भविष्य में ChatGPT और WebGPT की क्षमताओं के विलय की संभावना पर चर्चा की गई। कुछ इंटरनेट उपयोगकर्ताओं को चैटजीपीटी के भीतर ऐसे संकेत मिले हैं जो सुझाव देते हैं कि वर्तमान में वेब पेज ब्राउज़ करने की सुविधा अक्षम है, लेकिन इसे भविष्य में जोड़ा जा सकता है। चैटजीपीटी और वेबजीपीटी को मिलाने से अधिक आकर्षक परिणाम मिल सकते हैं, क्योंकि जानकारी वास्तविक समय में अपडेट की जाएगी और तथ्यों की प्रामाणिकता के अधिक सटीक आकलन की सुविधा प्रदान करेगी।


जब WebGPT के साथ संयोजन की बात आती है, तो यह क्रिया-संचालित LLM प्रशिक्षण फ़्लोचार्ट के बाईं ओर से संबंधित होता है, जो बाहरी सूचना स्रोतों और टूल लाइब्रेरी को जोड़ता है। वेब खोज केवल एक संभावना है; अधिक विविध कार्य प्रदान करने के लिए ChatGPT को विभिन्न उपकरणों, जैसे विभिन्न कार्यालय सॉफ़्टवेयर और SaaS सॉफ़्टवेयर के साथ भी जोड़ा जा सकता है।


उत्पाद स्तर पर, बेहतर इंटरफेस और कार्यान्वयन विधियों पर चर्चा करना उचित है। एक साथ-साथ डायलॉग बॉक्स का प्रारूप अपेक्षाओं को बढ़ा सकता है क्योंकि इसमें वार्तालाप प्रवाह सुनिश्चित करने की आवश्यकता होती है। Github Copilot इसे बखूबी करता है। कोपिलॉट प्रोग्रामिंग जोड़ियों में माहिर हैं और पार्टनर के रूप में सुझाव देते हैं। उपयोगकर्ता अच्छे सुझावों को स्वीकार कर सकते हैं और बुरे सुझावों को अस्वीकार कर सकते हैं। यहां तक कि अगर कई सुझावों को खारिज कर दिया जाता है, तो यादृच्छिक अंतराल पर उत्पन्न एक प्रभावी सुझाव प्राप्त करने का आनंद व्यसनी हो सकता है। यदि चैटजीपीटी भविष्य में एक लेखन, पटकथा लेखन या कार्य सहायक बन जाता है, तो कोपिलॉट के समान एक उत्पाद रूप लोगों के लिए स्वीकार करना आसान होगा।


अंत में, बहुत से लोग चैटजीपीटी की क्षमताओं से चकित हैं, लेकिन असली चमत्कार अभी बाकी है। OpenAI की ताकत न केवल बड़े मॉडलों को समझने में है, बल्कि इसकी इंजीनियर करने की क्षमता और पुनरावृत्त रूप से प्रतिक्रिया प्राप्त करने के साथ-साथ AI और मानव लक्ष्यों के बीच संरेखण पर इसके काम में भी निहित है। OpenAI के सीईओ सैम ऑल्टमैन के शब्द, "एक्सपोनेंशियल पर भरोसा करें। फ्लैट लुकिंग बैकवर्ड, वर्टिकल लुकिंग फ़ॉरवर्ड," हमारी वर्तमान उड़ान भरने की स्थिति को व्यक्त करते हैं।

इल्ला क्लाउड का परिचय

ILLA क्लाउड एक लो-कोड डेवलपमेंट प्लेटफॉर्म है जिसमें दर्जनों फ्रंट-एंड कंपोनेंट्स और डेटाबेस एपीआई इंटीग्रेशन हैं। आप कंपोनेंट्स को ड्रैग और ड्रॉप करके और फुल-स्टैक डेवलपमेंट को जल्दी से पूरा करने के लिए अपने डेटाबेस या एपीआई से कनेक्ट करके फ्रंट-एंड इंटरफेस बनाने के लिए ILLA क्लाउड का उपयोग कर सकते हैं।


ILLA गर्व से हगिंग फेस, नेचुरल लैंग्वेज प्रोसेसिंग (NLP) टूल और सेवाओं के एक सूट के साथ साझेदारी की घोषणा करता है। वे अपने ओपन-सोर्स एनएलपी लाइब्रेरी के लिए सबसे प्रसिद्ध हैं, जो टेक्स्ट जेनरेशन, लैंग्वेज ट्रांसलेशन और नामित इकाई पहचान उपकरण प्रदान करता है। हगिंग फेस के साथ, ILLA पहले से अधिक उत्पादक है। हमारे उपयोगकर्ता एआई के साथ और अधिक कर सकते हैं।


ILLA क्लाउड आमतौर पर उपयोग किए जाने वाले दर्जनों फ्रंट-एंड घटक प्रदान करता है, जिससे आप अपनी विशिष्ट आवश्यकताओं के आधार पर विभिन्न फ्रंट-एंड इंटरफेस जल्दी से बना सकते हैं। उसी समय, ILLA हगिंग फेस के लिए एक कनेक्शन प्रदान करता है, जिससे आप जल्दी से एपीआई से जुड़ सकते हैं, अनुरोध भेज सकते हैं और लौटाया गया डेटा प्राप्त कर सकते हैं। एपीआई और फ्रंट-एंड घटकों को जोड़कर, आप इस आवश्यकता को लागू कर सकते हैं कि उपयोगकर्ता फ्रंट-एंड के माध्यम से सामग्री दर्ज कर सकते हैं और इसे एपीआई में जमा कर सकते हैं। एपीआई उत्पन्न सामग्री को सामने के छोर पर प्रदर्शित करने के लिए लौटाता है।


ILLA क्लाउड की भविष्य की योजना के लिए, कृपया हमारा रोडमैप देखें: https://github.com/orgs/illacloud/projects/4


हम इल्ला क्लाउड के भविष्य को लेकर उत्साहित हैं, और हमें उम्मीद है कि आप भी होंगे। यदि आप इस यात्रा में हमारे साथ जुड़ना चाहते हैं, तो यहां कुछ तरीके दिए गए हैं, जिनसे आप जुड़ सकते हैं:

  • ILLA क्लाउड को निःशुल्क आज़माएं और अपने स्वयं के आंतरिक टूल बनाना प्रारंभ करें।
  • पर हमें का पालन करें ट्विटर , Linkedin , यूट्यूब , dev.to , उत्पाद शिकार , कलह , या GitHub .
  • अपनी प्रतिक्रिया, सुझाव, प्रश्न या प्रशंसापत्र हमारे साथ साझा करें।




हमारे डिस्कॉर्ड समुदाय में शामिल हों: discord.com/invite/illacloud मुफ्त में ILLA क्लाउड आज़माएं: क्लाउड.illacloud.com ILLA होम पेज: illacloud.com GitHub पेज: github.com/illacloud/illa-builder



यहाँ भी दिखाई देता है।