सबसे पहले मेरे ट्विटर को सब्सक्राइब करें, मैं तकनीकी चीजों के बारे में ट्वीट करता हूँ
श्रृंखला में एक और गति दौड़, चलो चलें
मैंने अभी आप पर सुदृढीकरण सीखने (आरएल) मेम का उपयोग किया है:
यह कैसा चारा था.. हे भगवान..
तो, मेम-केल्विन के लिए RL क्या है यह सीखना कठिन क्यों है? क्योंकि वह अवधारणा को समझने के बजाय RL के कार्यान्वयन को सीखना चाहता है, इसीलिए मेम-केल्विन!
जब आप कोई नई चीज, उपकरण या तकनीक या कुछ भी सीखते हैं - तो आप इसके कार्यान्वयन से शुरुआत नहीं करते हैं, आप उन विचारों, अवधारणाओं और समस्याओं से शुरुआत करते हैं जिन्हें उपकरण हल करता है!
वो केल्विन, यह लीजिए: सुदृढीकरण अधिगम (आरएल) को समझने के लिए - एक वीडियो गेम खेलने के बारे में सोचिए जहां आप सही चाल चलने के लिए अंक अर्जित करते हैं।
सुदृढीकरण सीखना ऐसा ही है - एक प्रोग्राम निर्णय लेने और अपने कार्यों के आधार पर पुरस्कार या दंड प्राप्त करके सीखता है
यह तो रीइनफोर्समेंट लर्निंग में स्टार्ट-विद-आइडियाज सिद्धांत लागू करने का एक उदाहरण मात्र था। लेकिन मैंने वादा किया था कि मैं आपको बताऊंगा कि 52 सेकंड में पूरी एमएल कैसे सीखी जाए...
52 सेकंड में एमएल सीखने के लिए आप एमएल अवधारणाएं सीखते हैं, कार्यान्वयन नहीं , फिर आप गूगल (या जीपीटी) कार्यान्वयन PyTorch या जो भी लाइब्रेरी नाम आपको पसंद है, उसे खोजते हैं, वैसे भी यह अगले वर्ष में बदलने वाला है और यह ठीक है, विचार बहुत लंबे समय तक समान रहेंगे - विचारों के लिए आगे बढ़ें!
पर्यवेक्षित शिक्षण में, प्रोग्राम को उत्तरों के साथ उदाहरणों का उपयोग करके पढ़ाया जाता है (जिसे लेबल किया गया डेटा कहा जाता है)। इससे प्रोग्राम को उदाहरणों और उत्तरों के बीच संबंध सीखने में मदद मिलती है, इसलिए यह नए उदाहरणों के उत्तरों का अनुमान लगा सकता है जिन्हें उसने पहले नहीं देखा है।
एल्गोरिदम और हल करने योग्य समस्याएं: मकान की कीमतों का पूर्वानुमान लगाना (रैखिक प्रतिगमन), यह निर्णय लेना कि ग्राहक कोई उत्पाद खरीदेगा या नहीं (निर्णय वृक्ष)
यहाँ, प्रोग्राम उत्तर रहित उदाहरणों (बिना लेबल वाले डेटा) को देखता है और उनके भीतर पैटर्न या समूह खोजने की कोशिश करता है। यह समान वस्तुओं को एक साथ समूहीकृत करने या डेटा का वर्णन करने के लिए आवश्यक जानकारी की मात्रा को कम करने जैसे कार्यों में मदद कर सकता है।
एल्गोरिदम और हल करने योग्य समस्याएं: समान संगीत रुचि वाले लोगों को समूहबद्ध करना (के-मीन्स क्लस्टरिंग), बहुत अधिक जानकारी खोए बिना छवियों को संपीड़ित करना (प्रमुख घटक विश्लेषण)
सुदृढीकरण सीखने में, कार्यक्रम चीजों को आज़माकर और पुरस्कार या दंड के रूप में प्रतिक्रिया प्राप्त करके निर्णय लेना सीखता है। लक्ष्य समय के साथ बेहतर निर्णय लेना और समस्याओं को अधिक प्रभावी ढंग से हल करना है।
एल्गोरिदम और हल करने योग्य समस्याएं: रोबोट को चलना सिखाना (क्यू-लर्निंग), प्रोग्राम को शतरंज खेलने का प्रशिक्षण देना (पॉलिसी ग्रेडिएंट विधियां)
यह प्रोग्राम को बेहतर तरीके से सीखने में मदद करने के लिए कच्चे डेटा से महत्वपूर्ण जानकारी (विशेषताएँ) चुनने की प्रक्रिया है। कभी-कभी, इसमें विशेषज्ञ ज्ञान और रचनात्मकता का उपयोग करके नई सुविधाएँ बनाना शामिल होता है।
उदाहरण: किसी पौधे की प्रजाति की पहचान करने में मदद के लिए पत्ती की लंबाई और चौड़ाई का उपयोग करना
यह देखना महत्वपूर्ण है कि मशीन लर्निंग मॉडल कितना अच्छा काम कर रहा है या नहीं। सटीकता, परिशुद्धता, रिकॉल, F1-स्कोर और माध्य वर्ग त्रुटि जैसे माप अक्सर मॉडल के प्रदर्शन की जांच करने के लिए उपयोग किए जाते हैं।
⏲️ 24 सेकंड बचे हैं, आप अच्छा कर रहे हैं!
आइये डीप लर्निंग पर भी चर्चा करें!
यह वास्तव में अमूर्त है। आप एक NN की कल्पना मस्तिष्क-न्यूरॉन्स के रूप में कर सकते हैं जो स्तंभों में व्यवस्थित हैं और एक दूसरे को बाएं से दाएं अलग-अलग बल (कनेक्शन के माध्यम से) के साथ पिंग करते हैं - जिस बल के साथ एक न्यूरॉन (प्रत्येक परत में) को पिंग किया जाता है वह अगले पिंग को परिभाषित करता है और इसलिए अंतिम परिणाम स्वयं होता है।
एल्गोरिदम और हल करने योग्य समस्याएं: छवियों में वस्तुओं को पहचानना (फीडफॉरवर्ड न्यूरल नेटवर्क), भाषाओं का अनुवाद करना (रेडियल बेसिस फंक्शन नेटवर्क)
जब आप कोई गलती करते हैं, तो आप उससे सीखते हैं और उसे दोहराने की कोशिश नहीं करते। बैकप्रोपेगेशन एक ऐसा तरीका है जिससे प्रोग्राम वही काम करता है।
इससे प्रोग्राम को यह समझने में मदद मिलती है कि कहां गलती हुई और सही उत्तर ढूंढने में मदद मिलती है।
सीएनएन विशेष तंत्रिका नेटवर्क हैं जो ग्रिड जैसे डेटा, जैसे चित्रों को समझ सकते हैं।
उनमें परतें होती हैं जो उन्हें पैटर्न सीखने और चित्र के भागों, जैसे रेखाओं और आकृतियों को पहचानने में मदद करती हैं।
एल्गोरिदम और हल करने योग्य समस्याएं: फोटो में चेहरे की पहचान करना (LeNet-5), छवियों में विभिन्न प्रकार के जानवरों की पहचान करना (AlexNet, VGG)
आरएनएन को अनुक्रम में आने वाले डेटा, जैसे संख्याओं या शब्दों की श्रृंखला, के साथ काम करने के लिए डिज़ाइन किया गया है।
वे पिछली जानकारियों को याद रख सकते हैं और उस जानकारी का उपयोग बेहतर निर्णय लेने के लिए कर सकते हैं।
एल्गोरिदम और हल करने योग्य समस्याएं: स्टॉक की कीमतों का पूर्वानुमान लगाना (लॉन्ग शॉर्ट-टर्म मेमोरी, LSTM), किसी दिए गए स्टाइल के आधार पर टेक्स्ट तैयार करना (गेटेड रिकरेंट यूनिट्स, GRU)
यह तब होता है जब एक प्रोग्राम मॉडल, जो पहले से ही बहुत कुछ सीख चुका है, को सीमित डेटा के साथ एक नए कार्य पर काम करने के लिए तैयार किया जाता है।
इससे प्रोग्राम को तेजी से सीखने और बेहतर प्रदर्शन करने में मदद मिलती है, क्योंकि यह पहले से सीखी गई उपयोगी चीजों को पहले से ही जानता है।
उदाहरण: विशिष्ट प्रकार की बिल्लियों को पहचानने के लिए कई कुत्तों की नस्लों (जैसे ResNet) पर प्रशिक्षित मॉडल का उपयोग करना
ये तकनीकें प्रोग्राम को डेटा से बहुत अधिक सीखने से बचने में मदद करती हैं, जिससे ओवरफिटिंग जैसी समस्याएं हो सकती हैं
समाप्त: 0 मिनट, 52 सेकंड
मूलतः यही है, अब जाइए और अपने एजेंटों को उन एल्गोरिदम और समस्याओं के लिए गूगल पर कार्यान्वयन के बारे में प्रशिक्षित कीजिए जिन्हें आप हल करना चाहते हैं!
किसी उपकरण का उपयोग शुरू करने के लिए, आप उस समस्या से शुरू करते हैं जिसे उपकरण हल करता है और सीखते हैं कि समस्या को हल करने के लिए कौन सी अवधारणा का उपयोग किया जाता है। "किसी उपकरण से कुछ कैसे करें" जैसे कार्यान्वयन को अपने दिमाग में न रखें, यह जटिल है और वैसे भी सब कुछ आपके दिमाग में फिट नहीं होगा।
विचार जानें, गूगल पर कार्यान्वयन देखें।
किसी क्रियान्वयन के बारे में 5-10 बार गूगल करने के बाद आप उसे याद कर लेंगे, फिर वह तकनीक पुरानी हो जाएगी और आप उसे भूल जाएंगे, कोई बात नहीं, ऐसा अक्सर होता रहता है।
विचारों को भूलना कठिन होता है, वे लम्बे समय तक आपकी स्मृति में बने रहते हैं
अलविदा और अगली ड्रैग रेस में मिलते हैं
रुको अक्षुण्ण!
यदि आप शिक्षा प्रणाली को व्यवहार-प्रधान और लाभकारी देखना चाहते हैं तो ट्विट बर्ड का अनुसरण करने के बारे में सोचें <3
वैसे भी आप ट्विटर का अनुसरण कर सकते हैं यदि आपको सिर्फ पाठ पसंद आया और आप और अधिक चाहते हैं या आप सामाजिक नेटवर्क पर मज़ा करने के आदी हैं
या किसी का अनुसरण मत करो और किसी की मत सुनो! अपना रास्ता स्वयं बनाओ!
मैं वास्तव में चाहता हूं कि आप मेरे ट्वीट्स का अनुसरण करें, यह सिर्फ एक बिक्री थी।
मेरा "43 सेकंड में REACT सीखें" देखें