एंटरप्राइज़ डेटा और क्लाउड प्रौद्योगिकियों में प्रगति के बारे में हम जो भी धारणाएँ बनाते हैं, उनके साथ एक स्पष्ट तथ्य है जिसे अक्सर अनदेखा कर दिया जाता है: अधिकांश महत्वपूर्ण एंटरप्राइज़ डेटा कॉर्पोरेट डेटा सेंटर में रहता है।
इसके बहुत सारे कारण हैं - कुछ वाजिब, कुछ बहुत ज्यादा नहीं। कुछ मामलों में, यह डेटा की अत्यधिक संवेदनशील प्रकृति के कारण होता है, चाहे वह HIPAA अनुपालन, संवेदनशील बैंकिंग डेटा या अन्य गोपनीयता संबंधी चिंताएँ हों। अन्य मामलों में, डेटा सिस्टम में रहता है (लीगेसी एंटरप्राइज रिसोर्स प्लानिंग डेटा या पेटाबाइट-स्केल वैज्ञानिक अनुसंधान डेटा के बारे में सोचें) जिसे क्लाउड पर ले जाना मुश्किल है। और कभी-कभी, यह सिर्फ जड़ता है। यह कोई बड़ा बहाना नहीं है, लेकिन यह हर समय होता है।
जो भी कारण हो, कॉर्पोरेट सर्वरों के रैक पर हाउसिंग डेटा कई उद्यमों की अपने व्यवसाय को बदलने के लिए एआई का लाभ उठाने की क्षमता के लिए एक वास्तविक बाधा साबित हुआ है, क्योंकि एआई को चलाने के लिए आवश्यक महत्वपूर्ण गणना शक्ति प्रदान करना असंभव है। अधिकांश डेटा केंद्रों को रेखांकित करने वाला बुनियादी ढाँचा।
लेकिन मशीन लर्निंग मॉडल को अनुकूलित करने और एआई को उन कंपनियों को उपलब्ध कराने के लिए स्टार्टअप और बड़े डिवाइस निर्माताओं के एक छोटे समूह के माध्यम से एक आंदोलन चल रहा है, जिनका डेटा क्लाउड में नहीं है। यह गेम चेंजर साबित होने वाला है।
ग्राफिकल प्रोसेसिंग यूनिट, या जीपीयू, आधुनिक वीडियो गेम और उच्च-रिज़ॉल्यूशन फिल्मों के लिए आवश्यक उच्च-तीव्रता वाले वीडियो-प्रोसेसिंग अनुप्रयोगों को संभालने के लिए विकसित किया गया था। लेकिन इन प्रोसेसरों की जटिल कार्यों को छोटे कार्यों में तोड़ने और उन्हें समानांतर में निष्पादित करने की क्षमता भी इन उच्च शक्ति वाले एप्लिकेशन-विशिष्ट एकीकृत सर्किट (एएसआईसी) को कृत्रिम बुद्धि के लिए बहुत उपयोगी बनाती है। एआई, आखिरकार, मशीन लर्निंग मॉडल को परिष्कृत और प्रशिक्षित करने के लिए डेटा के बड़े पैमाने पर प्रवाह की आवश्यकता होती है।
दूसरी ओर, सीपीयू, सर्वरों के लचीले दिमाग हैं, और, जैसे, वे विभिन्न प्रकार के संचालन को संभालने के लिए बनाए गए हैं, जैसे हार्ड ड्राइव डेटा तक पहुंचना, या डेटा को कैश से स्टोरेज में ले जाना, लेकिन उनमें क्षमता की कमी है इन कार्यों को समानांतर में करें (मल्टीकोर प्रोसेसर समानांतर कार्यों को संभाल सकते हैं, लेकिन जीपीयू के स्तर पर नहीं)। वे केवल एआई की मांग वाले उच्च-थ्रूपुट वर्कलोड को संभालने के लिए नहीं बनाए गए हैं।
उच्च-प्रदर्शन वाले जीपीयू बहुत महंगे हैं और हाल तक, वे दुर्लभ थे, इन उच्च-प्रदर्शन चिप्स पर क्रिप्टो खनिकों की निर्भरता के लिए धन्यवाद। अधिकांश भाग के लिए, वे क्लाउड प्रदाताओं के दायरे में हैं। दरअसल, उच्च-प्रदर्शन कंप्यूटिंग सेवाएं एक बड़ा कारण है कि कंपनियां अपने डेटा को क्लाउड पर ले जाती हैं। गूगल का
जीपीयू एआई इनोवेशन की भीड़ का आधार रहा है जिसने हाल ही में सुर्खियां बटोरी हैं। इन हाई-प्रोफाइल विकासों में से अधिकांश दक्षता या अनुकूलन के बारे में बहुत अधिक सोचे बिना क्या संभव है, इस पर लिफाफे को आगे बढ़ाने वाली कंपनियों द्वारा संचालित किया गया है। नतीजतन, नए एआई उपकरणों द्वारा निर्मित वर्कलोड बड़े पैमाने पर हो गया है, और इसलिए, आवश्यकता से, क्लाउड में प्रबंधित किया गया।
लेकिन पिछले छह महीनों में, वह बदल रहा है। एक बात तो यह है कि इन सभी अत्याधुनिक एआई उपकरणों को संचालित करने वाले व्यापक एमएल मॉडल महत्वपूर्ण रूप से संघनित हो रहे हैं, लेकिन फिर भी समान शक्तिशाली परिणाम उत्पन्न कर रहे हैं।
मैंने स्थापित किया
विकुना परियोजना से उभरा
यह एक ऐसा मिशन है जिसकी बड़ी तकनीक अनदेखी नहीं कर रही है। Apple के नवीनतम डेस्कटॉप और iPhones में विशिष्ट प्रसंस्करण क्षमताएँ हैं जो ML प्रक्रियाओं को गति देती हैं। Google और Apple ML के लिए भी अपने सॉफ़्टवेयर को ऑप्टिमाइज़ करने के लिए बहुत काम कर रहे हैं।
स्टार्टअप्स में ढेर सारे प्रतिभाशाली इंजीनियर भी हैं जो हार्डवेयर को इस तरह से अधिक प्रदर्शनकारी बनाने के लिए काम कर रहे हैं जिससे एआई/एमएल को अधिक सुलभ बनाया जा सके।
इस सारी कड़ी मेहनत और नवाचार के कारण, AI अब क्लाउड में डेटा वाले संगठनों के लिए विशेष रूप से उपलब्ध नहीं होगा। यह गोपनीयता के लिए बेहद महत्वपूर्ण है, जो एक बड़ा कारण है कि कई संगठन अपने डेटा को अपने सर्वर पर पहले स्थान पर रखते हैं।
एआई परिवर्तन लहर के साथ जिसने पिछले 18 महीनों में सब कुछ खत्म कर दिया है, यह सब डेटा के बारे में है। वास्तव में, डेटा के बिना कोई AI नहीं है, चाहे वह कहीं भी हो। थर्डएआई जैसी टीमों के प्रयास भी सभी संगठनों को "एआई को डेटा में लाने" में सक्षम बनाते हैं।
लंबे समय से, कंपनियों को इसके विपरीत करने के लिए मजबूर किया गया है: अपना डेटा एआई में लाएं। महत्वपूर्ण अंतर्दृष्टि के लिए विश्लेषण करने से पहले उन्हें डेटा वेयरहाउस और डेटा झीलों से डेटा माइग्रेट करने के लिए बड़े पैमाने पर संसाधनों, समय और बजट को समर्पित मशीन लर्निंग प्लेटफॉर्म पर समर्पित करना पड़ा।
इसके परिणामस्वरूप महत्वपूर्ण डेटा स्थानांतरण लागतें आती हैं, और माइग्रेट करने, विश्लेषण करने और माइग्रेट करने के लिए आवश्यक समय इस बात को प्रभावित करता है कि संगठन कितनी जल्दी नए पैटर्न सीख सकते हैं और पल में ग्राहकों के साथ कार्रवाई कर सकते हैं।
एआई को डेटा में लाना कुछ ऐसा है जिस पर हमने अपने रीयल-टाइम एआई प्रयासों के साथ डेटास्टैक्स पर बहुत अधिक ध्यान केंद्रित किया है, क्योंकि यह एमएल/एआई के आधार पर कार्रवाई करने, ग्राहकों को प्रसन्न करने और राजस्व बढ़ाने का सबसे तेज़ तरीका है। केवल क्लाउड ही नहीं बल्कि एआई को डेटा सेंटर में लाना, परिवर्तनकारी एआई प्रौद्योगिकी तरंग बनाने के लिए एक और बहुत महत्वपूर्ण कदम है, जिसका सभी कंपनियां हिस्सा बन सकती हैं।
*नए के बारे में जानें
एड अनफ द्वारा, डेटास्टैक्स
यहाँ भी प्रकाशित हुआ।