paint-brush
डाटासेंटर में एआई लानाद्वारा@datastax
144 रीडिंग

डाटासेंटर में एआई लाना

द्वारा DataStax5m2023/06/20
Read on Terminal Reader

बहुत लंबा; पढ़ने के लिए

केवल क्लाउड ही नहीं बल्कि एआई को डेटा सेंटर में लाना, परिवर्तनकारी एआई प्रौद्योगिकी तरंग बनाने के लिए एक और बहुत महत्वपूर्ण कदम है, जिसका सभी कंपनियां हिस्सा बन सकती हैं।
featured image - डाटासेंटर में एआई लाना
DataStax HackerNoon profile picture
0-item
1-item

एंटरप्राइज़ डेटा और क्लाउड प्रौद्योगिकियों में प्रगति के बारे में हम जो भी धारणाएँ बनाते हैं, उनके साथ एक स्पष्ट तथ्य है जिसे अक्सर अनदेखा कर दिया जाता है: अधिकांश महत्वपूर्ण एंटरप्राइज़ डेटा कॉर्पोरेट डेटा सेंटर में रहता है।


इसके बहुत सारे कारण हैं - कुछ वाजिब, कुछ बहुत ज्यादा नहीं। कुछ मामलों में, यह डेटा की अत्यधिक संवेदनशील प्रकृति के कारण होता है, चाहे वह HIPAA अनुपालन, संवेदनशील बैंकिंग डेटा या अन्य गोपनीयता संबंधी चिंताएँ हों। अन्य मामलों में, डेटा सिस्टम में रहता है (लीगेसी एंटरप्राइज रिसोर्स प्लानिंग डेटा या पेटाबाइट-स्केल वैज्ञानिक अनुसंधान डेटा के बारे में सोचें) जिसे क्लाउड पर ले जाना मुश्किल है। और कभी-कभी, यह सिर्फ जड़ता है। यह कोई बड़ा बहाना नहीं है, लेकिन यह हर समय होता है।


जो भी कारण हो, कॉर्पोरेट सर्वरों के रैक पर हाउसिंग डेटा कई उद्यमों की अपने व्यवसाय को बदलने के लिए एआई का लाभ उठाने की क्षमता के लिए एक वास्तविक बाधा साबित हुआ है, क्योंकि एआई को चलाने के लिए आवश्यक महत्वपूर्ण गणना शक्ति प्रदान करना असंभव है। अधिकांश डेटा केंद्रों को रेखांकित करने वाला बुनियादी ढाँचा।


लेकिन मशीन लर्निंग मॉडल को अनुकूलित करने और एआई को उन कंपनियों को उपलब्ध कराने के लिए स्टार्टअप और बड़े डिवाइस निर्माताओं के एक छोटे समूह के माध्यम से एक आंदोलन चल रहा है, जिनका डेटा क्लाउड में नहीं है। यह गेम चेंजर साबित होने वाला है।

प्रसंस्करण शक्ति की समस्या

ग्राफिकल प्रोसेसिंग यूनिट, या जीपीयू, आधुनिक वीडियो गेम और उच्च-रिज़ॉल्यूशन फिल्मों के लिए आवश्यक उच्च-तीव्रता वाले वीडियो-प्रोसेसिंग अनुप्रयोगों को संभालने के लिए विकसित किया गया था। लेकिन इन प्रोसेसरों की जटिल कार्यों को छोटे कार्यों में तोड़ने और उन्हें समानांतर में निष्पादित करने की क्षमता भी इन उच्च शक्ति वाले एप्लिकेशन-विशिष्ट एकीकृत सर्किट (एएसआईसी) को कृत्रिम बुद्धि के लिए बहुत उपयोगी बनाती है। एआई, आखिरकार, मशीन लर्निंग मॉडल को परिष्कृत और प्रशिक्षित करने के लिए डेटा के बड़े पैमाने पर प्रवाह की आवश्यकता होती है।


दूसरी ओर, सीपीयू, सर्वरों के लचीले दिमाग हैं, और, जैसे, वे विभिन्न प्रकार के संचालन को संभालने के लिए बनाए गए हैं, जैसे हार्ड ड्राइव डेटा तक पहुंचना, या डेटा को कैश से स्टोरेज में ले जाना, लेकिन उनमें क्षमता की कमी है इन कार्यों को समानांतर में करें (मल्टीकोर प्रोसेसर समानांतर कार्यों को संभाल सकते हैं, लेकिन जीपीयू के स्तर पर नहीं)। वे केवल एआई की मांग वाले उच्च-थ्रूपुट वर्कलोड को संभालने के लिए नहीं बनाए गए हैं।


उच्च-प्रदर्शन वाले जीपीयू बहुत महंगे हैं और हाल तक, वे दुर्लभ थे, इन उच्च-प्रदर्शन चिप्स पर क्रिप्टो खनिकों की निर्भरता के लिए धन्यवाद। अधिकांश भाग के लिए, वे क्लाउड प्रदाताओं के दायरे में हैं। दरअसल, उच्च-प्रदर्शन कंप्यूटिंग सेवाएं एक बड़ा कारण है कि कंपनियां अपने डेटा को क्लाउड पर ले जाती हैं। गूगल का टेंसर प्रोसेसिंग यूनिट , या TPU, एक कस्टम ASIC है जिसे केवल मशीन लर्निंग वर्कलोड में तेजी लाने के लिए विकसित किया गया है। एआई/एमएल वर्कलोड को शक्ति प्रदान करने के लिए अमेज़न के पास अपने स्वयं के चिप्स भी हैं।

एआई के लिए अनुकूलन

जीपीयू एआई इनोवेशन की भीड़ का आधार रहा है जिसने हाल ही में सुर्खियां बटोरी हैं। इन हाई-प्रोफाइल विकासों में से अधिकांश दक्षता या अनुकूलन के बारे में बहुत अधिक सोचे बिना क्या संभव है, इस पर लिफाफे को आगे बढ़ाने वाली कंपनियों द्वारा संचालित किया गया है। नतीजतन, नए एआई उपकरणों द्वारा निर्मित वर्कलोड बड़े पैमाने पर हो गया है, और इसलिए, आवश्यकता से, क्लाउड में प्रबंधित किया गया।


लेकिन पिछले छह महीनों में, वह बदल रहा है। एक बात तो यह है कि इन सभी अत्याधुनिक एआई उपकरणों को संचालित करने वाले व्यापक एमएल मॉडल महत्वपूर्ण रूप से संघनित हो रहे हैं, लेकिन फिर भी समान शक्तिशाली परिणाम उत्पन्न कर रहे हैं।


मैंने स्थापित किया विकग्ना मेरे मोबाइल फोन पर ऐप, उदाहरण के लिए। यह एक 13 बिलियन-पैरामीटर मॉडल है जो चैटजीपीटी जैसा निष्पादन करता है और वास्तविक समय में ठीक मेरे फोन पर चलता है। यह क्लाउड में बिल्कुल भी नहीं है - यह एक ऐसा ऐप है जो डिवाइस पर रहता है।


विकुना परियोजना से उभरा बड़े मॉडल सिस्टम संगठन , यूसी बर्कले, यूसी डेविस और कार्नेगी मेलन विश्वविद्यालय के बीच एक मिशन के साथ "खुले डेटासेट, मॉडल, सिस्टम और मूल्यांकन उपकरण के सह-विकास द्वारा बड़े मॉडल को सभी के लिए सुलभ बनाने के लिए।"


यह एक ऐसा मिशन है जिसकी बड़ी तकनीक अनदेखी नहीं कर रही है। Apple के नवीनतम डेस्कटॉप और iPhones में विशिष्ट प्रसंस्करण क्षमताएँ हैं जो ML प्रक्रियाओं को गति देती हैं। Google और Apple ML के लिए भी अपने सॉफ़्टवेयर को ऑप्टिमाइज़ करने के लिए बहुत काम कर रहे हैं।


स्टार्टअप्स में ढेर सारे प्रतिभाशाली इंजीनियर भी हैं जो हार्डवेयर को इस तरह से अधिक प्रदर्शनकारी बनाने के लिए काम कर रहे हैं जिससे एआई/एमएल को अधिक सुलभ बनाया जा सके।


थर्डएआई एक महान उदाहरण है। कंपनी एक सॉफ्टवेयर-आधारित इंजन प्रदान करती है जो सीपीयू का उपयोग करके बड़े डीप-लर्निंग मॉडल को प्रशिक्षित कर सकता है। DataStax महीनों से थर्डएआई टीम के साथ प्रयोग कर रहा है और उन्होंने जो विकसित किया है उससे प्रभावित हुए हैं - इतना कि पिछले हफ्ते हमने कंपनी के साथ साझेदारी की घोषणा की ताकि परिष्कृत बड़े भाषा मॉडल (एलएलएम) और अन्य एआई प्रौद्योगिकियों को किसी भी संगठन के लिए सुलभ बनाया जा सके। , चाहे उनका डेटा कहीं भी रहता हो। (साझेदारी समाचार के बारे में और पढ़ें यहाँ ).

एआई को डेटा में लाएं

इस सारी कड़ी मेहनत और नवाचार के कारण, AI अब क्लाउड में डेटा वाले संगठनों के लिए विशेष रूप से उपलब्ध नहीं होगा। यह गोपनीयता के लिए बेहद महत्वपूर्ण है, जो एक बड़ा कारण है कि कई संगठन अपने डेटा को अपने सर्वर पर पहले स्थान पर रखते हैं।


एआई परिवर्तन लहर के साथ जिसने पिछले 18 महीनों में सब कुछ खत्म कर दिया है, यह सब डेटा के बारे में है। वास्तव में, डेटा के बिना कोई AI नहीं है, चाहे वह कहीं भी हो। थर्डएआई जैसी टीमों के प्रयास भी सभी संगठनों को "एआई को डेटा में लाने" में सक्षम बनाते हैं।


लंबे समय से, कंपनियों को इसके विपरीत करने के लिए मजबूर किया गया है: अपना डेटा एआई में लाएं। महत्वपूर्ण अंतर्दृष्टि के लिए विश्लेषण करने से पहले उन्हें डेटा वेयरहाउस और डेटा झीलों से डेटा माइग्रेट करने के लिए बड़े पैमाने पर संसाधनों, समय और बजट को समर्पित मशीन लर्निंग प्लेटफॉर्म पर समर्पित करना पड़ा।


इसके परिणामस्वरूप महत्वपूर्ण डेटा स्थानांतरण लागतें आती हैं, और माइग्रेट करने, विश्लेषण करने और माइग्रेट करने के लिए आवश्यक समय इस बात को प्रभावित करता है कि संगठन कितनी जल्दी नए पैटर्न सीख सकते हैं और पल में ग्राहकों के साथ कार्रवाई कर सकते हैं।


एआई को डेटा में लाना कुछ ऐसा है जिस पर हमने अपने रीयल-टाइम एआई प्रयासों के साथ डेटास्टैक्स पर बहुत अधिक ध्यान केंद्रित किया है, क्योंकि यह एमएल/एआई के आधार पर कार्रवाई करने, ग्राहकों को प्रसन्न करने और राजस्व बढ़ाने का सबसे तेज़ तरीका है। केवल क्लाउड ही नहीं बल्कि एआई को डेटा सेंटर में लाना, परिवर्तनकारी एआई प्रौद्योगिकी तरंग बनाने के लिए एक और बहुत महत्वपूर्ण कदम है, जिसका सभी कंपनियां हिस्सा बन सकती हैं।


*नए के बारे में जानें डेटास्टैक्स एआई पार्टनर प्रोग्राम , जो ग्राहकों के लिए एआई अनुप्रयोगों के विकास और तैनाती में तेजी लाने के लिए उद्यमों को ग्राउंडब्रेकिंग एआई स्टार्टअप से जोड़ता है।*


एड अनफ द्वारा, डेटास्टैक्स


यहाँ भी प्रकाशित हुआ।