हम सभी ने GPT-3 के बारे में सुना है और इसकी क्षमताओं के बारे में कुछ हद तक स्पष्ट है। आपने निश्चित रूप से इस मॉडल के कारण पैदा हुए कुछ अनुप्रयोगों को देखा होगा, जिनमें से कुछ को मैंने मॉडल के बारे में में कवर किया था। GPT-3 OpenAI द्वारा विकसित एक मॉडल है जिसे आप सशुल्क API के माध्यम से एक्सेस कर सकते हैं लेकिन मॉडल तक आपकी कोई पहुंच नहीं है।
जो चीज GPT-3 को इतना मजबूत बनाती है, वह है इसकी वास्तुकला और आकार दोनों। इसमें 175 अरब पैरामीटर हैं। यह हमारे दिमाग में न्यूरॉन्स की संख्या से दोगुना है!
इस विशाल नेटवर्क को पूरे इंटरनेट पर यह समझने के लिए प्रशिक्षित किया गया था कि हम टेक्स्ट कैसे लिखते हैं, एक्सचेंज करते हैं और समझते हैं। इस हफ्ते, मेटा ने समुदाय के लिए एक बड़ा कदम आगे बढ़ाया है। उन्होंने अभी एक मॉडल जारी किया है जो उतना ही शक्तिशाली है, यदि अधिक नहीं है, और इसे पूरी तरह से ओपन-सोर्स किया है। वह कितना शांत है? वीडियो में और जानें...
►पूरा लेख पढ़ें: https://www.louisbouchard.ai/opt-meta/
झांग, सुसान एट अल। "ऑप्ट: पूर्व-प्रशिक्षित ट्रांसफार्मर भाषा मॉडल खोलें।" https://arxiv.org/abs/2205.01068
My GPT-3 का वीडियो बड़े भाषा मॉडल के लिए:
►मेटा की पोस्ट: https://ai.facebook.com/blog/democratizing-access-to-large-scale-language-models-with-opt-175b/
कोड: https://github.com/facebookresearch/metaseq
►माई न्यूज़लेटर (आपके ईमेल पर साप्ताहिक रूप से समझाया गया एक नया AI एप्लिकेशन!): https://www.louisbouchard.ai/newsletter/
हमारे डिस्कॉर्ड चैनल से जुड़ें, एक साथ एआई सीखें: https://discord.gg/learnaitately
0:00
हम सभी ने gpt3 के बारे में सुना है और है
0:02
कुछ हद तक इसका स्पष्ट विचार
0:03
क्षमताओं को आपने निश्चित रूप से देखा है
0:06
कुछ आवेदन सख्ती से पैदा हुए हैं
0:08
यह मॉडल जिनमें से कुछ को मैंने कवर किया है
0:10
पिछला वीडियो gpd3 एक विकसित मॉडल है
0:13
openai द्वारा जिसे आप a . के माध्यम से एक्सेस कर सकते हैं
0:15
पेड एपीआई लेकिन मॉडल तक उनकी कोई पहुंच नहीं है
0:18
स्वयं जो gpt3 को इतना मजबूत बनाता है वह दोनों है
0:21
इसकी वास्तुकला और इसका आकार है
0:24
175 अरब पैरामीटर दो बार राशि
0:27
हमारे दिमाग में न्यूरॉन्स की यह
0:30
विशाल नेटवर्क काफी प्रशिक्षित था
0:32
पूरे इंटरनेट पर यह समझने के लिए कि कैसे
0:34
हम विनिमय लिखते हैं और पाठ को समझते हैं
0:37
इस हफ्ते मेटा ने एक बड़ा कदम उठाया है
0:39
समुदाय के लिए आगे वे बस
0:41
एक मॉडल जारी किया है जो बस के रूप में है
0:43
शक्तिशाली यदि अधिक नहीं है और पूरी तरह से है
0:46
ओपन सोर्स यह कितना अच्छा है कि हम कर सकते हैं
0:48
अब एक जीपीटी-जैसे मॉडल तक पहुंच है और
0:51
बिना जाए सीधे इसके साथ खेलें
0:53
एक एपीआई और सीमित पहुंच मेटा के माध्यम से
0:56
नवीनतम मॉडल विकल्प जिसका अर्थ है
0:59
खुला पूर्व-प्रशिक्षित ट्रांसफार्मर है
1:01
के साथ कई आकारों में उपलब्ध है
1:03
खेलने या करने के लिए पूर्व-प्रशिक्षित भार
1:05
कोई शोध कार्य जिसमें से एक है
1:07
gp23 की तुलना में और सबसे अच्छा है
1:09
परिणाम के लिए बहुत अच्छी खबर है
1:12
क्षेत्र और विशेष रूप से हमारे लिए अकादमिक
1:14
शोधकर्ता तो बस gpg3 को यह नया पसंद करते हैं
1:17
मॉडल उपयोगकर्ता इनपुट से पाठ उत्पन्न कर सकता है
1:19
बहुत सारे अलग-अलग कार्यों पर एक दिन यह
1:22
सप्ताहों को संक्षेप में प्रस्तुत करने में भी सक्षम होंगे
1:24
स्पष्ट रिपोर्ट में आपके लिए काम के लायक
1:26
लेकिन तब तक आपको अभी भी लिखना होगा
1:28
उन्हें स्वयं कम से कम आप कुछ प्राप्त कर सकते हैं
1:30
इस रिपोर्टिंग प्रक्रिया को अधिक बनाने में मदद करें
1:33
जैसे महान टूल का उपयोग करके अधिक कुशल
1:35
यह एपिसोड वजन और पूर्वाग्रहों को प्रायोजित करता है
1:38
वजन और पूर्वाग्रह आपको आसानी से अनुमति देता है
1:39
के साथ अपने सभी प्रयोगों पर नज़र रखें
1:41
आपके में केवल कुछ ही पंक्तियाँ जोड़ी गईं
1:44
कोड लेकिन अधिक विशेष रूप से यह वास्तव में है
1:46
अच्छा है कि उन्होंने सृजन को कैसे सुगम बनाया
1:48
अद्भुत दिखने वाली इंटरैक्टिव रिपोर्ट्स की
1:50
जैसे यह आपकी टीम को स्पष्ट रूप से दिखा रहा है
1:53
या भविष्य में ही आपका रन मैट्रिक्स
1:55
हाइपरपैरामीटर और डेटा कॉन्फ़िगरेशन
1:57
आपके या आपकी टीम के पास मौजूद किसी भी नोट के साथ
2:00
उस समय रिपोर्ट आसानी से की जाती है
2:02
आपके द्वारा उत्पन्न निम्नलिखित टेम्पलेट्स
2:04
मेट्रिक्स चलाता है और आपको बस जोड़ना है
2:06
आपकी टिप्पणियाँ यह एक शक्तिशाली विशेषता है
2:08
या तो किसी पर त्वरित टिप्पणियाँ जोड़ें
2:10
प्रयोग करें या परिष्कृत विश्लेषण बनाएं
2:12
आपके काम को कैप्चर करना और साझा करना
2:14
यदि आप अपने में सुधार करना चाहते हैं तो यह आवश्यक है
2:16
पेशेवर वाहक इसलिए मैं अनुशंसा करता हूं
2:18
संचार में सुधार करने वाले उपकरणों का उपयोग करना
2:20
अपनी टीम में वजन और पूर्वाग्रह की तरह कोशिश करें
2:23
इसे नीचे दिए गए पहले लिंक के साथ शुरू करें और शुरू करें
2:25
एक समर्थक की तरह अपना काम साझा करना
2:29
ऑप्ट या अधिक सटीक रूप से ऑप्ट-175b
2:33
बहुत gpt3 के समान है इसलिए मैं दृढ़ता से
2:36
मेरे वीडियो को बेहतर तरीके से देखने की सलाह दें
2:37
समझें कि कितने बड़े भाषा मॉडल
2:40
काम gpd3 और ऑप्ट कम से कम नहीं कर सकता
2:42
अपने ईमेल को सारांशित करें या जल्दी लिखें
2:44
एक विषय पर आधारित निबंध यह भी कर सकता है
2:46
बुनियादी गणित की समस्याओं को हल करें उत्तर
2:49
प्रश्न और अधिक मुख्य अंतर
2:51
gpt3 के साथ यह है कि यह खुला है
2:53
स्रोत जिसका अर्थ है कि आपके पास पहुंच है
2:56
इसका कोड और यहां तक कि पूर्व-प्रशिक्षित मॉडल भी
2:58
सीधे एक और महत्वपूर्ण के साथ खेलें
3:00
मजेदार तथ्य यह है कि ऑप्ट के प्रशिक्षण के रूप में प्रयोग किया जाता है
3:03
gpt3 . के रूप में कार्बन फुटप्रिंट का 7वां हिस्सा
3:06
जो सही में एक और कदम है
3:08
दिशा आप देख सकते हैं कि यह नया
3:10
मॉडल gpt3 के समान है लेकिन खुला है
3:13
स्रोत तो एक भाषा मॉडल का उपयोग कर
3:15
ट्रांसफॉर्मर जिन्हें मैंने वीडियो में कवर किया है
3:18
इससे पहले कई पर प्रशिक्षित किया गया था
3:19
विभिन्न डेटा सेट पर कोई कह सकता है
3:22
पाठ को संसाधित करने के लिए संपूर्ण इंटरनेट और
3:24
बेहतर ढंग से समझने के लिए और पाठ उत्पन्न करें
3:27
वे कैसे काम करते हैं मैं आपको फिर से संदर्भित करता हूं
3:29
वीडियो मैंने gpt3 को कवर करते हुए बनाया है जैसे वे हैं
3:31
बहुत समान मॉडल यहाँ मैं वास्तव में क्या हूँ
3:34
कवर करना चाहता था मेटा बनाने का प्रयास है
3:36
इस तरह के मॉडल के लिए सुलभ
3:38
हर कोई बहुत प्रयास करते हुए
3:40
अपनी सीमाओं के पूर्वाग्रहों को साझा करने में और
3:43
उदाहरण के लिए जोखिम उन्होंने देखा कि ऑप्ट
3:45
दोहराव हो जाता है और फंस जाता है
3:48
एक लूप जो हमारे लिए शायद ही कभी होता है
3:50
नहीं तो तब से कोई तुमसे बात नहीं करेगा
3:53
यह इंटरनेट पर प्रशिक्षित किया गया था वे भी
3:55
पाया कि ऑप्ट में उच्च प्रवृत्ति है
3:57
विषाक्त भाषा उत्पन्न करें और सुदृढ़ करें
4:00
मूल रूप से हानिकारक रूढ़ियाँ
4:02
हमारे सामान्य व्यवहारों की नकल करना और
4:04
पक्षपात यह तथ्यात्मक रूप से भी उत्पन्न कर सकता है
4:07
गलत बयान जो है
4:08
अवांछनीय यदि आप चाहते हैं कि लोग लें
4:10
आप गंभीरता से ये सीमाएँ कुछ हैं
4:13
इन सबसे महत्वपूर्ण कारणों में से
4:15
मॉडल जल्द ही इंसानों की जगह नहीं लेंगे
4:17
महत्वपूर्ण निर्णय लेने वाली नौकरियों के लिए या
4:20
वाणिज्यिक में भी सुरक्षित रूप से इस्तेमाल किया जा सकता है
4:22
उत्पादों को पढ़ने के लिए मैं आपको आमंत्रित करता हूं
4:24
के उनके गहन विश्लेषण के लिए कागज
4:26
मॉडल की क्षमता और बेहतर समझ
4:28
इस मॉडल को और अधिक बनाने में उनके प्रयास
4:30
पर्यावरण के अनुकूल और उपयोग करने के लिए सुरक्षित
4:33
आप उनके बारे में और भी पढ़ सकते हैं
4:34
प्रशिक्षण प्रक्रिया और इसे स्वयं आजमाएं
4:36
उनके सार्वजनिक रूप से उपलब्ध कोड के साथ सभी
4:39
लिंक विवरण में हैं जैसे
4:41
नए के साथ खुला स्रोत योगदान
4:43
मॉडल प्रलेखन और कोड उपलब्ध
4:45
शोध के लिए वास्तव में महत्वपूर्ण हैं
4:47
विज्ञान को आगे बढ़ाने के लिए समुदाय और मैं हूँ
4:49
खुशी है कि मेटा जैसी बड़ी कंपनी ऐसा करती है
4:52
उनके लिए धन्यवाद आसपास के शोधकर्ता
4:54
दुनिया प्रयोग कर सकेगी
4:56
अत्याधुनिक भाषा मॉडल के साथ
4:58
छोटे संस्करणों के बजाय मैं उत्साहित हूँ
5:00
सभी आगामी प्रगति देखने के लिए it
5:02
बनाएंगे और मुझे यह देखना अच्छा लगेगा कि आप क्या हैं
5:04
दोस्तों इसके साथ टिप्पणी करने के लिए स्वतंत्र महसूस करें
5:06
वीडियो के तहत या हमारे समुदाय में शामिल हों
5:09
अनदेखा करें और अपनी परियोजनाओं को साझा करें
5:10
वहां इसे एक साथ सीखना कहा जाता है और
5:13
आप नीचे एक लिंक भी पा सकते हैं मुझे उम्मीद है
5:15
आपने इस सप्ताह के वीडियो का आनंद लिया जो कि a . था
5:17
इसे कवर करने वाले सामान्य से थोड़ा अलग
5:19
रोमांचक समाचार और आवश्यक प्रयास
5:21
सार्वजनिक रूप से उपलब्ध शोध को साझा करें I
5:24
अगले हफ्ते मिलते हैं एक और अद्भुत के साथ
5:26
कागज़