paint-brush
मेटा का नया मॉडल ऑप्ट एक ओपन-सोर्स GPT-3 हैद्वारा@whatsai
7,870 रीडिंग
7,870 रीडिंग

मेटा का नया मॉडल ऑप्ट एक ओपन-सोर्स GPT-3 है

द्वारा Louis Bouchard4m2022/05/06
Read on Terminal Reader
Read this story w/o Javascript

बहुत लंबा; पढ़ने के लिए

हम सभी ने GPT-3 के बारे में सुना है और इसकी क्षमताओं के बारे में कुछ हद तक स्पष्ट है। आपने निश्चित रूप से इस मॉडल के कारण पैदा हुए कुछ अनुप्रयोगों को देखा होगा, जिनमें से कुछ को मैंने मॉडल के बारे में पिछले वीडियो में कवर किया था। GPT-3 OpenAI द्वारा विकसित एक मॉडल है जिसे आप सशुल्क API के माध्यम से एक्सेस कर सकते हैं लेकिन मॉडल तक आपकी कोई पहुंच नहीं है। जो चीज GPT-3 को इतना मजबूत बनाती है, वह है इसकी वास्तुकला और आकार दोनों। इसमें 175 अरब पैरामीटर हैं। यह हमारे दिमाग में न्यूरॉन्स की संख्या से दोगुना है! इस विशाल नेटवर्क को पूरे इंटरनेट पर यह समझने के लिए प्रशिक्षित किया गया था कि हम टेक्स्ट कैसे लिखते हैं, एक्सचेंज करते हैं और समझते हैं। इस हफ्ते, मेटा ने समुदाय के लिए एक बड़ा कदम आगे बढ़ाया है। उन्होंने अभी एक मॉडल जारी किया है जो उतना ही शक्तिशाली है, यदि अधिक नहीं है, और इसे पूरी तरह से ओपन-सोर्स किया है। वह कितना शांत है? वीडियो में और जानें...

Companies Mentioned

Mention Thumbnail
Mention Thumbnail
featured image - मेटा का नया मॉडल ऑप्ट एक ओपन-सोर्स GPT-3 है
Louis Bouchard HackerNoon profile picture

हम सभी ने GPT-3 के बारे में सुना है और इसकी क्षमताओं के बारे में कुछ हद तक स्पष्ट है। आपने निश्चित रूप से इस मॉडल के कारण पैदा हुए कुछ अनुप्रयोगों को देखा होगा, जिनमें से कुछ को मैंने मॉडल के बारे में में कवर किया था। GPT-3 OpenAI द्वारा विकसित एक मॉडल है जिसे आप सशुल्क API के माध्यम से एक्सेस कर सकते हैं लेकिन मॉडल तक आपकी कोई पहुंच नहीं है।

जो चीज GPT-3 को इतना मजबूत बनाती है, वह है इसकी वास्तुकला और आकार दोनों। इसमें 175 अरब पैरामीटर हैं। यह हमारे दिमाग में न्यूरॉन्स की संख्या से दोगुना है!

इस विशाल नेटवर्क को पूरे इंटरनेट पर यह समझने के लिए प्रशिक्षित किया गया था कि हम टेक्स्ट कैसे लिखते हैं, एक्सचेंज करते हैं और समझते हैं। इस हफ्ते, मेटा ने समुदाय के लिए एक बड़ा कदम आगे बढ़ाया है। उन्होंने अभी एक मॉडल जारी किया है जो उतना ही शक्तिशाली है, यदि अधिक नहीं है, और इसे पूरी तरह से ओपन-सोर्स किया है। वह कितना शांत है? वीडियो में और जानें...

वीडियो देखना

संदर्भ

►पूरा लेख पढ़ें: https://www.louisbouchard.ai/opt-meta/
झांग, सुसान एट अल। "ऑप्ट: पूर्व-प्रशिक्षित ट्रांसफार्मर भाषा मॉडल खोलें।" https://arxiv.org/abs/2205.01068
My GPT-3 का वीडियो बड़े भाषा मॉडल के लिए:
►मेटा की पोस्ट: https://ai.facebook.com/blog/democratizing-access-to-large-scale-language-models-with-opt-175b/
कोड: https://github.com/facebookresearch/metaseq
►माई न्यूज़लेटर (आपके ईमेल पर साप्ताहिक रूप से समझाया गया एक नया AI एप्लिकेशन!): https://www.louisbouchard.ai/newsletter/
हमारे डिस्कॉर्ड चैनल से जुड़ें, एक साथ एआई सीखें: https://discord.gg/learnaitately

वीडियो प्रतिलेख

0:00

हम सभी ने gpt3 के बारे में सुना है और है

0:02

कुछ हद तक इसका स्पष्ट विचार

0:03

क्षमताओं को आपने निश्चित रूप से देखा है

0:06

कुछ आवेदन सख्ती से पैदा हुए हैं

0:08

यह मॉडल जिनमें से कुछ को मैंने कवर किया है

0:10

पिछला वीडियो gpd3 एक विकसित मॉडल है

0:13

openai द्वारा जिसे आप a . के माध्यम से एक्सेस कर सकते हैं

0:15

पेड एपीआई लेकिन मॉडल तक उनकी कोई पहुंच नहीं है

0:18

स्वयं जो gpt3 को इतना मजबूत बनाता है वह दोनों है

0:21

इसकी वास्तुकला और इसका आकार है

0:24

175 अरब पैरामीटर दो बार राशि

0:27

हमारे दिमाग में न्यूरॉन्स की यह

0:30

विशाल नेटवर्क काफी प्रशिक्षित था

0:32

पूरे इंटरनेट पर यह समझने के लिए कि कैसे

0:34

हम विनिमय लिखते हैं और पाठ को समझते हैं

0:37

इस हफ्ते मेटा ने एक बड़ा कदम उठाया है

0:39

समुदाय के लिए आगे वे बस

0:41

एक मॉडल जारी किया है जो बस के रूप में है

0:43

शक्तिशाली यदि अधिक नहीं है और पूरी तरह से है

0:46

ओपन सोर्स यह कितना अच्छा है कि हम कर सकते हैं

0:48

अब एक जीपीटी-जैसे मॉडल तक पहुंच है और

0:51

बिना जाए सीधे इसके साथ खेलें

0:53

एक एपीआई और सीमित पहुंच मेटा के माध्यम से

0:56

नवीनतम मॉडल विकल्प जिसका अर्थ है

0:59

खुला पूर्व-प्रशिक्षित ट्रांसफार्मर है

1:01

के साथ कई आकारों में उपलब्ध है

1:03

खेलने या करने के लिए पूर्व-प्रशिक्षित भार

1:05

कोई शोध कार्य जिसमें से एक है

1:07

gp23 की तुलना में और सबसे अच्छा है

1:09

परिणाम के लिए बहुत अच्छी खबर है

1:12

क्षेत्र और विशेष रूप से हमारे लिए अकादमिक

1:14

शोधकर्ता तो बस gpg3 को यह नया पसंद करते हैं

1:17

मॉडल उपयोगकर्ता इनपुट से पाठ उत्पन्न कर सकता है

1:19

बहुत सारे अलग-अलग कार्यों पर एक दिन यह

1:22

सप्ताहों को संक्षेप में प्रस्तुत करने में भी सक्षम होंगे

1:24

स्पष्ट रिपोर्ट में आपके लिए काम के लायक

1:26

लेकिन तब तक आपको अभी भी लिखना होगा

1:28

उन्हें स्वयं कम से कम आप कुछ प्राप्त कर सकते हैं

1:30

इस रिपोर्टिंग प्रक्रिया को अधिक बनाने में मदद करें

1:33

जैसे महान टूल का उपयोग करके अधिक कुशल

1:35

यह एपिसोड वजन और पूर्वाग्रहों को प्रायोजित करता है

1:38

वजन और पूर्वाग्रह आपको आसानी से अनुमति देता है

1:39

के साथ अपने सभी प्रयोगों पर नज़र रखें

1:41

आपके में केवल कुछ ही पंक्तियाँ जोड़ी गईं

1:44

कोड लेकिन अधिक विशेष रूप से यह वास्तव में है

1:46

अच्छा है कि उन्होंने सृजन को कैसे सुगम बनाया

1:48

अद्भुत दिखने वाली इंटरैक्टिव रिपोर्ट्स की

1:50

जैसे यह आपकी टीम को स्पष्ट रूप से दिखा रहा है

1:53

या भविष्य में ही आपका रन मैट्रिक्स

1:55

हाइपरपैरामीटर और डेटा कॉन्फ़िगरेशन

1:57

आपके या आपकी टीम के पास मौजूद किसी भी नोट के साथ

2:00

उस समय रिपोर्ट आसानी से की जाती है

2:02

आपके द्वारा उत्पन्न निम्नलिखित टेम्पलेट्स

2:04

मेट्रिक्स चलाता है और आपको बस जोड़ना है

2:06

आपकी टिप्पणियाँ यह एक शक्तिशाली विशेषता है

2:08

या तो किसी पर त्वरित टिप्पणियाँ जोड़ें

2:10

प्रयोग करें या परिष्कृत विश्लेषण बनाएं

2:12

आपके काम को कैप्चर करना और साझा करना

2:14

यदि आप अपने में सुधार करना चाहते हैं तो यह आवश्यक है

2:16

पेशेवर वाहक इसलिए मैं अनुशंसा करता हूं

2:18

संचार में सुधार करने वाले उपकरणों का उपयोग करना

2:20

अपनी टीम में वजन और पूर्वाग्रह की तरह कोशिश करें

2:23

इसे नीचे दिए गए पहले लिंक के साथ शुरू करें और शुरू करें

2:25

एक समर्थक की तरह अपना काम साझा करना

2:29

ऑप्ट या अधिक सटीक रूप से ऑप्ट-175b

2:33

बहुत gpt3 के समान है इसलिए मैं दृढ़ता से

2:36

मेरे वीडियो को बेहतर तरीके से देखने की सलाह दें

2:37

समझें कि कितने बड़े भाषा मॉडल

2:40

काम gpd3 और ऑप्ट कम से कम नहीं कर सकता

2:42

अपने ईमेल को सारांशित करें या जल्दी लिखें

2:44

एक विषय पर आधारित निबंध यह भी कर सकता है

2:46

बुनियादी गणित की समस्याओं को हल करें उत्तर

2:49

प्रश्न और अधिक मुख्य अंतर

2:51

gpt3 के साथ यह है कि यह खुला है

2:53

स्रोत जिसका अर्थ है कि आपके पास पहुंच है

2:56

इसका कोड और यहां तक कि पूर्व-प्रशिक्षित मॉडल भी

2:58

सीधे एक और महत्वपूर्ण के साथ खेलें

3:00

मजेदार तथ्य यह है कि ऑप्ट के प्रशिक्षण के रूप में प्रयोग किया जाता है

3:03

gpt3 . के रूप में कार्बन फुटप्रिंट का 7वां हिस्सा

3:06

जो सही में एक और कदम है

3:08

दिशा आप देख सकते हैं कि यह नया

3:10

मॉडल gpt3 के समान है लेकिन खुला है

3:13

स्रोत तो एक भाषा मॉडल का उपयोग कर

3:15

ट्रांसफॉर्मर जिन्हें मैंने वीडियो में कवर किया है

3:18

इससे पहले कई पर प्रशिक्षित किया गया था

3:19

विभिन्न डेटा सेट पर कोई कह सकता है

3:22

पाठ को संसाधित करने के लिए संपूर्ण इंटरनेट और

3:24

बेहतर ढंग से समझने के लिए और पाठ उत्पन्न करें

3:27

वे कैसे काम करते हैं मैं आपको फिर से संदर्भित करता हूं

3:29

वीडियो मैंने gpt3 को कवर करते हुए बनाया है जैसे वे हैं

3:31

बहुत समान मॉडल यहाँ मैं वास्तव में क्या हूँ

3:34

कवर करना चाहता था मेटा बनाने का प्रयास है

3:36

इस तरह के मॉडल के लिए सुलभ

3:38

हर कोई बहुत प्रयास करते हुए

3:40

अपनी सीमाओं के पूर्वाग्रहों को साझा करने में और

3:43

उदाहरण के लिए जोखिम उन्होंने देखा कि ऑप्ट

3:45

दोहराव हो जाता है और फंस जाता है

3:48

एक लूप जो हमारे लिए शायद ही कभी होता है

3:50

नहीं तो तब से कोई तुमसे बात नहीं करेगा

3:53

यह इंटरनेट पर प्रशिक्षित किया गया था वे भी

3:55

पाया कि ऑप्ट में उच्च प्रवृत्ति है

3:57

विषाक्त भाषा उत्पन्न करें और सुदृढ़ करें

4:00

मूल रूप से हानिकारक रूढ़ियाँ

4:02

हमारे सामान्य व्यवहारों की नकल करना और

4:04

पक्षपात यह तथ्यात्मक रूप से भी उत्पन्न कर सकता है

4:07

गलत बयान जो है

4:08

अवांछनीय यदि आप चाहते हैं कि लोग लें

4:10

आप गंभीरता से ये सीमाएँ कुछ हैं

4:13

इन सबसे महत्वपूर्ण कारणों में से

4:15

मॉडल जल्द ही इंसानों की जगह नहीं लेंगे

4:17

महत्वपूर्ण निर्णय लेने वाली नौकरियों के लिए या

4:20

वाणिज्यिक में भी सुरक्षित रूप से इस्तेमाल किया जा सकता है

4:22

उत्पादों को पढ़ने के लिए मैं आपको आमंत्रित करता हूं

4:24

के उनके गहन विश्लेषण के लिए कागज

4:26

मॉडल की क्षमता और बेहतर समझ

4:28

इस मॉडल को और अधिक बनाने में उनके प्रयास

4:30

पर्यावरण के अनुकूल और उपयोग करने के लिए सुरक्षित

4:33

आप उनके बारे में और भी पढ़ सकते हैं

4:34

प्रशिक्षण प्रक्रिया और इसे स्वयं आजमाएं

4:36

उनके सार्वजनिक रूप से उपलब्ध कोड के साथ सभी

4:39

लिंक विवरण में हैं जैसे

4:41

नए के साथ खुला स्रोत योगदान

4:43

मॉडल प्रलेखन और कोड उपलब्ध

4:45

शोध के लिए वास्तव में महत्वपूर्ण हैं

4:47

विज्ञान को आगे बढ़ाने के लिए समुदाय और मैं हूँ

4:49

खुशी है कि मेटा जैसी बड़ी कंपनी ऐसा करती है

4:52

उनके लिए धन्यवाद आसपास के शोधकर्ता

4:54

दुनिया प्रयोग कर सकेगी

4:56

अत्याधुनिक भाषा मॉडल के साथ

4:58

छोटे संस्करणों के बजाय मैं उत्साहित हूँ

5:00

सभी आगामी प्रगति देखने के लिए it

5:02

बनाएंगे और मुझे यह देखना अच्छा लगेगा कि आप क्या हैं

5:04

दोस्तों इसके साथ टिप्पणी करने के लिए स्वतंत्र महसूस करें

5:06

वीडियो के तहत या हमारे समुदाय में शामिल हों

5:09

अनदेखा करें और अपनी परियोजनाओं को साझा करें

5:10

वहां इसे एक साथ सीखना कहा जाता है और

5:13

आप नीचे एक लिंक भी पा सकते हैं मुझे उम्मीद है

5:15

आपने इस सप्ताह के वीडियो का आनंद लिया जो कि a . था

5:17

इसे कवर करने वाले सामान्य से थोड़ा अलग

5:19

रोमांचक समाचार और आवश्यक प्रयास

5:21

सार्वजनिक रूप से उपलब्ध शोध को साझा करें I

5:24

अगले हफ्ते मिलते हैं एक और अद्भुत के साथ

5:26

कागज़