सबसे पहले को सब्सक्राइब करें, मैं तकनीकी चीजों के बारे में ट्वीट करता हूँ मेरे ट्विटर में एक और गति दौड़, चलो चलें श्रृंखला मैंने अभी आप पर सुदृढीकरण सीखने (आरएल) मेम का उपयोग किया है: आप पोस्ट खोलें (सही काम करें) आपको मीम (इनाम) मिलेगा यह कैसा चारा था.. हे भगवान.. तो, मेम-केल्विन के लिए RL क्या है यह सीखना कठिन क्यों है? क्योंकि वह RL के चाहता है, इसीलिए मेम-केल्विन! अवधारणा को समझने के बजाय कार्यान्वयन को सीखना जब आप कोई नई चीज, उपकरण या तकनीक या कुछ भी सीखते हैं - तो आप इसके कार्यान्वयन से शुरुआत नहीं करते हैं, आप उन विचारों, अवधारणाओं और समस्याओं से शुरुआत करते हैं जिन्हें उपकरण हल करता है! वो केल्विन, यह लीजिए: सुदृढीकरण अधिगम (आरएल) को समझने के लिए - एक वीडियो गेम खेलने के बारे में सोचिए जहां आप सही चाल चलने के लिए अंक अर्जित करते हैं। सुदृढीकरण सीखना ऐसा ही है - एक प्रोग्राम निर्णय लेने और अपने कार्यों के आधार पर पुरस्कार या दंड प्राप्त करके सीखता है यह तो रीइनफोर्समेंट लर्निंग में स्टार्ट-विद-आइडियाज सिद्धांत लागू करने का एक उदाहरण मात्र था। लेकिन मैंने वादा किया था कि मैं आपको बताऊंगा कि 52 सेकंड में पूरी एमएल कैसे सीखी जाए... स्पीडरन! 52 सेकंड में एमएल सीखने के लिए आप , फिर आप गूगल (या जीपीटी) कार्यान्वयन PyTorch या जो भी लाइब्रेरी नाम आपको पसंद है, उसे खोजते हैं, वैसे भी यह अगले वर्ष में बदलने वाला है और यह ठीक है, विचार बहुत लंबे समय तक समान रहेंगे - एमएल अवधारणाएं सीखते हैं, कार्यान्वयन नहीं विचारों के लिए आगे बढ़ें! मशीन लर्निंग विचार 1. पर्यवेक्षित शिक्षण पर्यवेक्षित शिक्षण में, प्रोग्राम को उत्तरों के साथ उदाहरणों का उपयोग करके पढ़ाया जाता है (जिसे लेबल किया गया डेटा कहा जाता है)। इससे प्रोग्राम को उदाहरणों और उत्तरों के बीच संबंध सीखने में मदद मिलती है, इसलिए यह नए उदाहरणों के उत्तरों का अनुमान लगा सकता है जिन्हें उसने पहले नहीं देखा है। मकान की कीमतों का पूर्वानुमान लगाना (रैखिक प्रतिगमन), यह निर्णय लेना कि ग्राहक कोई उत्पाद खरीदेगा या नहीं (निर्णय वृक्ष) एल्गोरिदम और हल करने योग्य समस्याएं: 2. अपर्यवेक्षित शिक्षण यहाँ, प्रोग्राम उत्तर रहित उदाहरणों (बिना लेबल वाले डेटा) को देखता है और उनके भीतर पैटर्न या समूह खोजने की कोशिश करता है। यह समान वस्तुओं को एक साथ समूहीकृत करने या डेटा का वर्णन करने के लिए आवश्यक जानकारी की मात्रा को कम करने जैसे कार्यों में मदद कर सकता है। समान संगीत रुचि वाले लोगों को समूहबद्ध करना (के-मीन्स क्लस्टरिंग), बहुत अधिक जानकारी खोए बिना छवियों को संपीड़ित करना (प्रमुख घटक विश्लेषण) एल्गोरिदम और हल करने योग्य समस्याएं: 3. सुदृढीकरण सीखना सुदृढीकरण सीखने में, कार्यक्रम चीजों को आज़माकर और पुरस्कार या दंड के रूप में प्रतिक्रिया प्राप्त करके निर्णय लेना सीखता है। लक्ष्य समय के साथ बेहतर निर्णय लेना और समस्याओं को अधिक प्रभावी ढंग से हल करना है। रोबोट को चलना सिखाना (क्यू-लर्निंग), प्रोग्राम को शतरंज खेलने का प्रशिक्षण देना (पॉलिसी ग्रेडिएंट विधियां) एल्गोरिदम और हल करने योग्य समस्याएं: 4. फीचर इंजीनियरिंग यह प्रोग्राम को बेहतर तरीके से सीखने में मदद करने के लिए कच्चे डेटा से महत्वपूर्ण जानकारी (विशेषताएँ) चुनने की प्रक्रिया है। कभी-कभी, इसमें विशेषज्ञ ज्ञान और रचनात्मकता का उपयोग करके नई सुविधाएँ बनाना शामिल होता है। किसी पौधे की प्रजाति की पहचान करने में मदद के लिए पत्ती की लंबाई और चौड़ाई का उपयोग करना उदाहरण: 5. मॉडल मूल्यांकन यह देखना महत्वपूर्ण है कि मशीन लर्निंग मॉडल कितना अच्छा काम कर रहा है या नहीं। सटीकता, परिशुद्धता, रिकॉल, F1-स्कोर और माध्य वर्ग त्रुटि जैसे माप अक्सर मॉडल के प्रदर्शन की जांच करने के लिए उपयोग किए जाते हैं। ⏲️ 24 सेकंड बचे हैं, आप अच्छा कर रहे हैं! आइये डीप लर्निंग पर भी चर्चा करें! गहन शिक्षण विचार 1. न्यूरल नेटवर्क (एनएन) यह वास्तव में अमूर्त है। आप एक NN की कल्पना मस्तिष्क-न्यूरॉन्स के रूप में कर सकते हैं जो स्तंभों में व्यवस्थित हैं और एक दूसरे को बाएं से दाएं अलग-अलग बल (कनेक्शन के माध्यम से) के साथ पिंग करते हैं - जिस बल के साथ एक न्यूरॉन (प्रत्येक परत में) को पिंग किया जाता है वह अगले पिंग को परिभाषित करता है और इसलिए अंतिम परिणाम स्वयं होता है। छवियों में वस्तुओं को पहचानना (फीडफॉरवर्ड न्यूरल नेटवर्क), भाषाओं का अनुवाद करना (रेडियल बेसिस फंक्शन नेटवर्क) एल्गोरिदम और हल करने योग्य समस्याएं: 2. बैकप्रोपेगेशन जब आप कोई गलती करते हैं, तो आप उससे सीखते हैं और उसे दोहराने की कोशिश नहीं करते। बैकप्रोपेगेशन एक ऐसा तरीका है जिससे प्रोग्राम वही काम करता है। इससे प्रोग्राम को यह समझने में मदद मिलती है कि कहां गलती हुई और सही उत्तर ढूंढने में मदद मिलती है। 3. कन्वोल्यूशनल न्यूरल नेटवर्क (सीएनएन) सीएनएन विशेष तंत्रिका नेटवर्क हैं जो ग्रिड जैसे डेटा, जैसे चित्रों को समझ सकते हैं। उनमें परतें होती हैं जो उन्हें पैटर्न सीखने और चित्र के भागों, जैसे रेखाओं और आकृतियों को पहचानने में मदद करती हैं। फोटो में चेहरे की पहचान करना (LeNet-5), छवियों में विभिन्न प्रकार के जानवरों की पहचान करना (AlexNet, VGG) एल्गोरिदम और हल करने योग्य समस्याएं: 4. पुनरावर्ती तंत्रिका नेटवर्क (आरएनएन) आरएनएन को अनुक्रम में आने वाले डेटा, जैसे संख्याओं या शब्दों की श्रृंखला, के साथ काम करने के लिए डिज़ाइन किया गया है। वे पिछली जानकारियों को याद रख सकते हैं और उस जानकारी का उपयोग बेहतर निर्णय लेने के लिए कर सकते हैं। स्टॉक की कीमतों का पूर्वानुमान लगाना (लॉन्ग शॉर्ट-टर्म मेमोरी, LSTM), किसी दिए गए स्टाइल के आधार पर टेक्स्ट तैयार करना (गेटेड रिकरेंट यूनिट्स, GRU) एल्गोरिदम और हल करने योग्य समस्याएं: 5. स्थानांतरण अधिगम यह तब होता है जब एक प्रोग्राम मॉडल, जो पहले से ही बहुत कुछ सीख चुका है, को सीमित डेटा के साथ एक नए कार्य पर काम करने के लिए तैयार किया जाता है। इससे प्रोग्राम को तेजी से सीखने और बेहतर प्रदर्शन करने में मदद मिलती है, क्योंकि यह पहले से सीखी गई उपयोगी चीजों को पहले से ही जानता है। विशिष्ट प्रकार की बिल्लियों को पहचानने के लिए कई कुत्तों की नस्लों (जैसे ResNet) पर प्रशिक्षित मॉडल का उपयोग करना उदाहरण: 6. नियमितीकरण तकनीक ये तकनीकें प्रोग्राम को डेटा से बहुत अधिक सीखने से बचने में मदद करती हैं, जिससे ओवरफिटिंग जैसी समस्याएं हो सकती हैं रुकें 🏁 0 मिनट, 52 सेकंड समाप्त: मूलतः यही है, अब जाइए और अपने एजेंटों को उन एल्गोरिदम और समस्याओं के लिए गूगल पर कार्यान्वयन के बारे में प्रशिक्षित कीजिए जिन्हें आप हल करना चाहते हैं! किसी उपकरण का उपयोग शुरू करने के लिए, आप उस समस्या से शुरू करते हैं जिसे उपकरण हल करता है और सीखते हैं कि समस्या को हल करने के लिए कौन सी अवधारणा का उपयोग किया जाता है। "किसी उपकरण से कुछ कैसे करें" जैसे कार्यान्वयन को अपने दिमाग में न रखें, यह जटिल है और वैसे भी सब कुछ आपके दिमाग में फिट नहीं होगा। विचार जानें, गूगल पर कार्यान्वयन देखें। किसी क्रियान्वयन के बारे में 5-10 बार गूगल करने के बाद आप उसे याद कर लेंगे, फिर वह तकनीक पुरानी हो जाएगी और आप उसे भूल जाएंगे, कोई बात नहीं, ऐसा अक्सर होता रहता है। विचारों को भूलना कठिन होता है, वे लम्बे समय तक आपकी स्मृति में बने रहते हैं अलविदा और अगली ड्रैग रेस में मिलते हैं रुको अक्षुण्ण! यदि आप शिक्षा प्रणाली को व्यवहार-प्रधान और लाभकारी देखना चाहते हैं तो के बारे में सोचें <3 ट्विट बर्ड का अनुसरण करने वैसे भी आप ट्विटर का अनुसरण कर सकते हैं यदि आपको सिर्फ पाठ पसंद आया और आप या आप सामाजिक नेटवर्क पर मज़ा करने के आदी हैं और अधिक चाहते हैं या किसी का अनुसरण मत करो और किसी की मत सुनो! अपना रास्ता स्वयं बनाओ! मैं वास्तव में चाहता हूं कि आप मेरे ट्वीट्स का अनुसरण करें, यह सिर्फ एक बिक्री थी। मेरा देखें "43 सेकंड में REACT सीखें"