paint-brush
दीपमाइंड मे ने हाल ही में दुनिया का पहला जनरल एआई बनाया हैद्वारा@whatsai
5,869 रीडिंग
5,869 रीडिंग

दीपमाइंड मे ने हाल ही में दुनिया का पहला जनरल एआई बनाया है

द्वारा Louis Bouchard3m2022/05/16
Read on Terminal Reader
Read this story w/o Javascript

बहुत लंबा; पढ़ने के लिए

दीपमाइंड से गाटो अभी प्रकाशित हुआ था! यह एक एकल ट्रांसफॉर्मर है जो अटारी गेम खेल सकता है, छवियों को कैप्शन कर सकता है, लोगों के साथ चैट कर सकता है, एक वास्तविक रोबोटिक आर्म को नियंत्रित कर सकता है, और बहुत कुछ! वास्तव में, यह एक बार प्रशिक्षित होता है और उन सभी कार्यों को प्राप्त करने के लिए समान भार का उपयोग करता है। गैटो एक मल्टी-मोडल एजेंट है जिसका अर्थ है कि यह छवियों के लिए कैप्शन बना सकता है या चैटबॉट के रूप में सवालों के जवाब दे सकता है। यह शब्दों, छवियों और यहां तक कि भौतिकी को भी समझता है... नीचे दिए गए वीडियो ट्रांसक्रिप्ट में और जानें।

Company Mentioned

Mention Thumbnail
featured image - दीपमाइंड मे ने हाल ही में दुनिया का पहला जनरल एआई बनाया है
Louis Bouchard HackerNoon profile picture

दीपमाइंड से गाटो अभी प्रकाशित हुआ था! यह एक एकल ट्रांसफॉर्मर है जो अटारी गेम खेल सकता है, छवियों को कैप्शन कर सकता है, लोगों के साथ चैट कर सकता है, एक वास्तविक रोबोटिक आर्म को नियंत्रित कर सकता है, और बहुत कुछ! वास्तव में, यह एक बार प्रशिक्षित होता है और उन सभी कार्यों को प्राप्त करने के लिए समान भार का उपयोग करता है। और दीपमाइंड के अनुसार, यह न केवल एक ट्रांसफॉर्मर है, बल्कि एक एजेंट भी है। ऐसा तब होता है जब आप ट्रांसफॉर्मर को मल्टी-टास्क रीइन्फोर्समेंट लर्निंग एजेंट्स पर प्रगति के साथ मिलाते हैं।

जैसा कि हमने कहा, Gato एक बहु-मॉडल एजेंट है। मतलब कि यह इमेज के लिए कैप्शन बना सकता है या चैटबॉट के तौर पर सवालों के जवाब दे सकता है। आप कहेंगे कि GPT-3 पहले से ही ऐसा कर सकता है, लेकिन Gato और भी कर सकता है... बहु-रूपता इस तथ्य से आती है कि Gato मानव स्तर पर अटारी खेल भी खेल सकता है या रोबोटिक हथियारों को नियंत्रित करने जैसे वास्तविक दुनिया के कार्य भी कर सकता है। वस्तुओं को ठीक से स्थानांतरित करें। यह शब्दों, छवियों और यहां तक कि भौतिकी को भी समझता है...

वीडियो में और जानें

संदर्भ

►पूरा लेख पढ़ें: https://www.louisbouchard.ai/deepmind-gato/
दीपमाइंड का ब्लॉग पोस्ट: https://www.deepmind.com/publications/a-generalist-agent
पेपर: रीड एस. एट अल।, 2022, डीमाइंड: गाटो, https://storage.googleapis.com/deepmind-media/A%20Generalist%20Agent/Generalist%20Agent.pdf
►माई न्यूज़लेटर (आपके ईमेल पर साप्ताहिक रूप से समझाया गया एक नया AI एप्लिकेशन!): https://www.louisbouchard.ai/newsletter/

वीडियो प्रतिलेख

0:00

गाटो फ्रॉम डीपमाइंड अभी प्रकाशित हुआ था

0:02

यह एक एकल ट्रांसफार्मर है जो खेल सकता है

0:04

अटारी खेल कैप्शन छवियों के साथ चैट करें

0:07

लोग एक वास्तविक रोबोटिक भुजा को नियंत्रित करते हैं और

0:09

More वास्तव में एक बार प्रशिक्षित किया जाता है और इसका उपयोग करता है

0:12

उन सभी कार्यों को प्राप्त करने के लिए समान भार

0:15

और डीपमाइंड के अनुसार यह केवल एक ही नहीं है

0:17

ट्रांसफार्मर लेकिन यह भी एक एजेंट है

0:20

क्या होता है जब आप ट्रांसफार्मर मिलाते हैं

0:22

बहु-कार्य पर प्रगति के साथ

0:23

सुदृढीकरण सीखने वाले एजेंट जैसा कि हमने कहा

0:26

गैटो एक बहु-मोडल एजेंट है जिसका अर्थ है कि

0:29

यह छवियों के लिए कैप्शन बना सकता है या

0:31

चैटबॉट के रूप में प्रश्नों के उत्तर दें, जिन्हें आप देखेंगे

0:34

वह gpt3 पहले से ही ऐसा कर सकता है लेकिन यहूदी बस्ती

0:36

बहुविधता अधिक से अधिक कर सकती है

0:39

तथ्य यह है कि यहूदी बस्ती भी अटारी खेल सकते हैं

0:41

मानव स्तर पर खेल या वास्तविक भी करते हैं

0:44

रोबोट को नियंत्रित करने जैसे विश्व कार्य

0:46

वस्तुओं को ठीक से स्थानांतरित करने के लिए हथियार

0:48

शब्दों को समझता है चित्र और यहां तक कि

0:51

भौतिकी यहूदी बस्ती पहले सामान्यवादी हैं

0:54

मॉडल जो इतने सारे पर इतना अच्छा प्रदर्शन करता है

0:56

विभिन्न कार्य और यह अत्यंत

0:58

इस क्षेत्र के लिए होनहार इसे प्रशिक्षित किया गया था

1:00

अलग-अलग के साथ 604 अलग-अलग कार्यों पर

1:03

तौर-तरीके अवलोकन और कार्रवाई

1:06

विनिर्देश इसे परिपूर्ण बनाते हैं

1:08

सामान्यवादी और जैसा कि मैंने कहा कि यह सब करता है

1:11

कि एक ही नेटवर्क और भार के साथ

1:13

और आपके पूछने से पहले इसे केवल 1.2 . की आवश्यकता है

1:15

gpt3 की तुलना में अरब पैरामीटर

1:18

आवश्यक है

1:19

उनमें से 175 अरब यह एक जाल नहीं है

1:22

जहां आपको यूनिट को फिर से प्रशिक्षित करना या लड़ना है

1:24

सभी कार्यों के लिए आप दोनों को एक छवि भेज सकते हैं

1:27

और पाठ और यह काम करेगा आप भी कर सकते हैं

1:29

रोबोट भुजा से कुछ हलचलें जोड़ें

1:32

मॉडल तय कर सकता है कि किस प्रकार का

1:34

इसके संदर्भ के आधार पर प्रदान करने के लिए आउटपुट

1:36

पाठ से लेकर असतत क्रियाओं तक

1:38

एक वातावरण अगर आपने वीडियो का आनंद लिया

1:41

कृपया सदस्यता लेने पर विचार करें और मुझे करने दें

1:43

जानिए अगर आपको इस तरह की खबर वीडियो पसंद आती है

1:46

मैं निश्चित रूप से और अधिक करता हूं यह संभव है

1:48

उनकी टोकनकरण प्रक्रिया के कारण

1:50

टोकनाइजेशन तब होता है जब आप अपनी तैयारी करते हैं

1:52

मोडल के लिए इनपुट जैसा कि वे नहीं करते हैं

1:55

पाठ या छवियों को स्वयं समझें

1:57

भाषा मॉडल और यहूदी बस्ती ले लिया

1:59

उदाहरण के लिए उप शब्दों की कुल संख्या 32

2:02

000 और प्रत्येक शब्द में एक संख्या निर्दिष्ट है

2:05

इसके लिए छवियों के लिए वे vit . का पालन करते हैं

2:08

व्यापक रूप से उपयोग किए जाने वाले पैच एम्बेडिंग

2:10

जैसा कि हमने पिछले में कवर किया था, रेसनेट ब्लॉक

2:12

वीडियो हमने बटन को भी टोकननाइज़ किया

2:14

अटारी के लिए पूर्णांक संख्या के रूप में दबाता है

2:16

खेल या असतत मूल्य अंत में

2:19

प्रोप्रियोसेप्टिव जैसे निरंतर मूल्य

2:21

इनपुट के बारे में हमने रोबोटिक के साथ बात की

2:23

हथियार उन्होंने अलग-अलग ट्रैक को एन्कोड किया

2:25

फ्लोट नंबरों में मैट्रिक्स और उन्हें जोड़ा

2:27

टेक्स्ट टोकन के बाद उन सभी का उपयोग कर

2:30

विभिन्न इनपुट जो एजेंट को अपनाता है

2:32

उपयुक्त उत्पन्न करने के लिए वर्तमान कार्य

2:34

प्रशिक्षण के दौरान आउटपुट वे प्रॉम्प्ट का उपयोग करते हैं

2:36

पहले के साथ gpt3 के रूप में कंडीशनिंग

2:39

नमूना कार्रवाई और अवलोकन

2:42

में सामान्यवादी आरएल एजेंटों में प्रगति

2:44

पिछले साल अविश्वसनीय रहे हैं और आ गए हैं

2:47

मुख्य रूप से गहरे मन से कोई यह देख सकता था कि

2:49

वे सुई को करीब ले जा रहे हैं

2:51

सामान्य ऐ या मानव स्तर की बुद्धि

2:55

अगर हम अंत में इसे परिभाषित कर सकते हैं तो मुझे यह पसंद है कि कैसे

2:57

उन्होंने अपने पेपर में कई विवरण दिए

2:59

और मैं यह देखने के लिए उत्साहित हूं कि वे क्या करेंगे

3:01

या अन्य लोग इसका उपयोग करके क्या करेंगे

3:03

मॉडल की वास्तुकला का लिंक

3:06

के बारे में अधिक जानकारी के लिए कागज

3:07

मॉडल विवरण में है मुझे आशा है कि आप

3:09

इस लघु वीडियो का आनंद लिया मैंने अभी इसे देखा

3:12

समाचार जब मैं उठा और मैं नहीं कर सका

3:13

इस वीडियो को बनाने के अलावा और कुछ भी

3:15

मेरा दिन शुरू करने से पहले बस इतना ही

3:17

रोमांचक मैं अगले सप्ताह आपसे मिलूंगा

एक और अद्भुत पेपर