यह एक परिचयात्मक लेख है जो पूर्वानुमानित मशीन लर्निंग मॉडल के विकास में बुनियादी अंतर्ज्ञान, गणितीय विचार और रेडियल आधार कार्यों के दायरे की व्याख्या करता है।
मशीन लर्निंग में, हाइपरप्लेन-आधारित एल्गोरिदम पर आधारित समस्या-समाधान अंतरिक्ष में डेटा बिंदुओं के वितरण पर बहुत अधिक निर्भर करता है। हालांकि, यह एक ज्ञात तथ्य है कि वास्तविक दुनिया के डेटा शायद ही कभी सैद्धांतिक मान्यताओं का पालन करते हैं।
बहुत सारे परिवर्तन कार्य हैं जो डेटा बिंदुओं के प्राकृतिक आकार को डेटा के छिपे हुए पैटर्न को बनाए रखने के लिए सैद्धांतिक रूप से अनुशंसित वितरण में परिवर्तित कर सकते हैं। रेडियल बेसिस एक ऐसा प्रसिद्ध कार्य है जिसकी चर्चा बहुत सारी मशीन लर्निंग पाठ्यपुस्तकों में की जाती है। इस लेख में, हम बुनियादी अंतर्ज्ञान, प्रकार और रेडियल आधार फ़ंक्शन के उपयोग के बारे में जानेंगे।
रेडियल बेसिस फ़ंक्शन एक गणितीय फ़ंक्शन है जो एक वास्तविक-मूल्यवान इनपुट लेता है और एक वास्तविक-मूल्यवान आउटपुट को आउटपुट करता है जो अंतरिक्ष में प्रक्षेपित इनपुट मान के बीच की दूरी के आधार पर एक काल्पनिक निश्चित बिंदु से कहीं और रखा जाता है।
यह फ़ंक्शन कई मशीन लर्निंग और डीप लर्निंग एल्गोरिदम जैसे सपोर्ट वेक्टर मशीन, आर्टिफिशियल न्यूरल नेटवर्क आदि में लोकप्रिय रूप से उपयोग किया जाता है।
आइए हम इस गणितीय फलन की अवधारणा और उपयोग को समझें।
वास्तविक समय में, जब भी हम एसवीएम जैसे एल्गोरिदम का उपयोग करके जटिल मशीन सीखने की समस्याओं को हल करते हैं, तो हमें अपने सभी डेटा बिंदुओं को एक काल्पनिक बहुआयामी स्थान में प्रोजेक्ट करने की आवश्यकता होती है, जहां प्रत्येक सुविधा एक आयाम होगी।
आइए मान लें कि हमारे पास भविष्यवाणी करने के लिए वर्गीकरण समस्या है कि कोई छात्र परीक्षा उत्तीर्ण करेगा या असफल होगा।
हमारे पास स्वतंत्र चर के रूप में निम्नलिखित विशेषताएं हैं:
तो, ये 3 स्वतंत्र चर इस तरह एक स्थान के 3 आयाम बन जाते हैं-
आइए विचार करें कि हमारे डेटा बिंदु इस तरह दिखते हैं-
हरा रंग उन छात्रों का प्रतिनिधित्व करता है जिन्होंने परीक्षा उत्तीर्ण की है
लाल रंग उन छात्रों का प्रतिनिधित्व करता है जो परीक्षा में अनुत्तीर्ण हो गए
अब, एसवीएम एक हाइपरप्लेन बनाएगा जो अनुत्तीर्ण और उत्तीर्ण छात्रों के बीच अंतर करने के लिए इन 3 आयामों के माध्यम से यात्रा करेगा-
तो, तकनीकी रूप से अब मॉडल समझता है कि हाइपरप्लेन के एक तरफ गिरने वाले प्रत्येक डेटा बिंदु उन छात्रों के हैं जिन्होंने परीक्षा उत्तीर्ण की है और इसके विपरीत।
हमारे उदाहरण में, हाइपरप्लेन बनाना आसान था क्योंकि एक रेखीय और सीधा हाइपरप्लेन 2 श्रेणियों में भेदभाव करने के लिए पर्याप्त था। लेकिन वास्तविक समय की जटिल परियोजनाओं में, कई परिदृश्यों में इन संबंधों का उल्लंघन हो सकता है। विशेष रूप से जब आपके पास सैकड़ों स्वतंत्र चर हैं, तो डेटा बिंदुओं के बीच एक रैखिक संबंध प्राप्त करने की कोई संभावना नहीं है जैसे कि एक इष्टतम हाइपरप्लेन बनाना मुश्किल होगा।
ऐसे परिदृश्यों में, शोधकर्ता आमतौर पर प्रत्येक डेटा बिंदु पर रेडियल आधार फ़ंक्शन लागू करते हैं ताकि वे समस्या को आसानी से हल करने के लिए डेटा बिंदुओं पर एक रेखीय हाइपरप्लेन पास कर सकें।
गौर कीजिए कि हमारे डेटा बिंदु अंतरिक्ष में इस तरह दिख रहे हैं-
यह स्पष्ट है कि हम एक रेखीय हाइपरप्लेन का उपयोग नहीं कर सकते हैं जैसे कि यह डेटा बिंदुओं को उनकी कक्षाओं के अनुसार समूहित कर सकता है।
इस प्रकार के परिदृश्यों में RBF हमारी सहायता करेगा।
कुछ शोधकर्ता आमतौर पर इन डेटा बिंदुओं को बहुत अधिक आयामों में प्रोजेक्ट करेंगे ताकि डेटा बिंदुओं के बीच की दूरी बढ़ती रहे ताकि वे हाइपरप्लेन बनाने के लिए कुछ फ़ंक्शन (आरबीएफ या कोई अन्य फ़ंक्शन) लागू कर सकें। लेकिन उच्च आयामों का निर्माण करना आवश्यक नहीं है क्योंकि यह हमेशा सांख्यिकीविद/शोधकर्ता का निर्णय होता है जो डेटा में पैटर्न को समझता है।
इसके बाद, हमें अंतरिक्ष में एक काल्पनिक बिंदु को इस तरह से चिन्हित करना होगा जहाँ हमें आवश्यकता हो।
उसके बाद, हमें इस काल्पनिक बिंदु के आधार पर कुछ संकेंद्रित वृत्त बनाने होंगे।
केंद्र और वृत्त की सीमा में स्थित किसी डेटा बिंदु के बीच की दूरी को त्रिज्या कहा जाता है।
त्रिज्या की गणना करने के बाद, हमें इस मान को एक गणितीय फ़ंक्शन (RBF) में पास करना होगा जो एक वास्तविक मान लौटाएगा। लौटाया गया मान आगे की कार्यवाही के लिए उपयोग किए जाने वाले किसी विशेष डेटा बिंदु का परिवर्तित परिमाण होगा।
कई प्रकार के रेडियल आधार कार्य हैं। उनमें से प्रत्येक इनपुट मान को एक अलग तरीके से रूपांतरित करेगा। उनमें से कुछ हैं-
कहाँ,
समारोह समय के संबंध में इस तरह दिखेगा,
कहाँ,
कहाँ,
मैं सहज रूप से समझाऊंगा कि ये कार्य अंतरिक्ष में सहज रूप से क्या करेंगे। इन कार्यों द्वारा की जाने वाली 2 अलग-अलग प्रक्रियाएं हैं-
विस्तार की प्रक्रिया कुछ इस तरह दिखेगी-
कम्प्रेशन की प्रक्रिया विजुअली कुछ इस तरह दिखेगी-
विस्तार और संपीड़न के बाद, डेटा बिंदु इस तरह रूपांतरित हो गए होंगे-
अब, हम आसानी से एक रेखीय हाइपरप्लेन का निर्माण कर सकते हैं जो डेटा बिंदुओं को इस तरह वर्गीकृत कर सकता है-
कभी-कभी, एक छिपी हुई परत के साथ कृत्रिम तंत्रिका नेटवर्क के साथ-साथ आरबीएफ का भी उपयोग किया जाता है। इस प्रकार के नेटवर्क में, RBF का उपयोग हिडन लेयर्स में एक्टिवेशन फंक्शन के रूप में किया जाएगा। छिपी हुई परत के अलावा, एक इनपुट परत होगी जिसमें कई न्यूरॉन्स होते हैं जहां उनमें से प्रत्येक एक विशेषता चर का प्रतिनिधित्व करता है और आउटपुट परत में नेटवर्क आउटपुट बनाने के लिए छिपी हुई परत से आउटपुट का भारित योग होगा।
ऐसे नेटवर्क को आरबीएफ नेटवर्क कहा जाता है।
इस लेख में, हमने मशीन लर्निंग में सबसे उपयोगी परिवर्तन कार्यों में से एक पर चर्चा की। मैंने एआईएमएल सीखने की जगह में शुरुआती लोगों को लक्षित करते हुए एक स्पष्ट तरीके से गहन गणितीय गणनाओं के बिना इस जटिल अवधारणा को समझाने की कोशिश की है।
यह फ़ंक्शन अधिकांश डेटा विज्ञान-उन्मुख प्रोग्रामिंग भाषाओं जैसे कि पायथन या आर में एक इनबिल्ट लाइब्रेरी के रूप में उपलब्ध है। इसलिए, सैद्धांतिक अंतर्ज्ञान को समझने के बाद इसे लागू करना आसान है। मैंने संदर्भ अनुभाग में कुछ उन्नत सामग्रियों के लिंक जोड़े हैं जहाँ आप रुचि रखते हैं तो जटिल गणनाओं में गहराई से गोता लगा सकते हैं।