आप अपने iPhone पर अपने दोस्त की एक खास तस्वीर ढूंढ रहे हैं, जो कुछ साल पहले ली गई थी। खोज करने के लिए हजारों छवियां हैं, लेकिन ऐप्पल फोटो ऐप सही व्यक्ति पर शून्य करता है, और प्रेस्टो, सेकंड के भीतर आपको वह चित्र मिल जाता है जिसे आप ढूंढ रहे हैं।
ऐसा करने के लिए पर्दे के पीछे बहुत काम है, जिसमें चेहरे की पहचान और छवि विश्लेषण और स्वचालित टैगिंग शामिल है, जो आवश्यक या वांछित है, और फिर वास्तविक समय में उन संदर्भों पर कार्य करके प्रयास को बचाने के लिए एक साथ आना।
Apple - और Google, FedEx, Uber, Netflix जैसी कंपनियों ने भी - सिस्टम और आर्किटेक्चर बनाने में वर्षों बिताए हैं जो उपयोगकर्ता के अनुभवों को आसान, अधिक व्यक्तिगत और अधिक सहज बनाने में सक्षम बनाते हैं। कुछ मामलों में, आर्टिफिशियल इंटेलिजेंस प्रमुख निर्णयों को लगभग तुरंत किए जाने या वास्तविक समय में होने वाली भविष्यवाणियों को सक्षम बनाता है, जो किसी व्यवसाय को पल में परिणामों में सुधार करने के लिए सशक्त बनाता है।
यह उद्यमों के व्यापक ब्रह्मांड पर खो नहीं गया है: ए के अनुसार
तो ऐसा क्यों है कि, अधिकांश संगठनों के लिए, सफल AI एप्लिकेशन बनाना एक बड़ी चुनौती है? इसे तीन बड़ी बाधाओं तक उबाला जा सकता है: गलत डेटा, गलत बुनियादी ढांचे में, गलत समय पर।
एआई को वास्तविक समय के अनुप्रयोगों में सफलतापूर्वक बनाने के रास्ते में कई बाधाएं खड़ी होती हैं, लेकिन अधिकांश एक केंद्रीय तत्व से संबंधित हैं: डेटा।
कई पारंपरिक ML/AI सिस्टम, और उनके द्वारा उत्पन्न परिणाम, डेटा वेयरहाउस और बैच प्रोसेसिंग पर निर्भर करते हैं। परिणाम: इस ऐतिहासिक डेटा को मशीन लर्निंग सिस्टम में "लाने" के लिए प्रौद्योगिकियों, डेटा आंदोलनों और परिवर्तनों की एक जटिल सरणी की आवश्यकता होती है।
एमएल मॉडल में डाले गए डेटा को फीचर कहा जाता है (मापने योग्य गुण जो विश्लेषण के लिए उपयोग किए जा सकते हैं), जो आम तौर पर एक एप्लिकेशन डेटाबेस में संग्रहीत डेटा पर आधारित होते हैं या लॉग फ़ाइलों में लिखे जाते हैं। उन्हें अक्सर परिवर्तनों की आवश्यकता होती है, जैसे स्केलिंग मान या पूर्व रिकॉर्ड के आधार पर संगणना (उदाहरण के लिए, एक रिकॉर्ड उत्पन्न होने के समय चलती औसत)।
यह आम तौर पर इनपुट से लेकर आउटपुट तक के डेटा के प्रवाह को धीमा कर देता है, जिसके परिणामस्वरूप छूटे हुए अवसर होते हैं, जिसके परिणामस्वरूप ग्राहक मंथन हो सकता है, या मान्यता प्राप्त साइबर सुरक्षा खतरे के पैटर्न का पता नहीं चल पाता है। चुनौतियों को अनुचित डेटासेट के रूप में अभिव्यक्त किया जा सकता है, जो गलत तरीके से चलने वाले बुनियादी ढाँचे द्वारा समर्थित है जो बहुत धीरे-धीरे चलता है।
डेटा की भारी मात्रा (और संबंधित लागत) के कारण, इसे परिवहन और उपलब्धता में आसानी के लिए एकत्रित किया जाना है। सीधे शब्दों में कहें, जो डेटा एकत्र या अत्यधिक रूपांतरित होता है, वह संगठनों को वास्तविक समय में उचित कार्यों की आसानी से पहचान करने से रोकता है और पसंदीदा परिणाम प्राप्त करने की संभावना को कम करता है, चाहे वह सुझाया गया उत्पाद हो, अद्यतन पैकेज वितरण मार्ग हो या कारखाने में मशीन पर समायोजित सेटिंग हो। . यह नए सवालों के जवाब खोजने, परिणामों की भविष्यवाणी करने या तेजी से विकसित होने वाले संदर्भ के अनुकूल होने के लिए संगठन की क्षमता को धीमा कर देता है।
डेटा वैज्ञानिकों को मोटे अनाज वाले डेटासेट का उपयोग करने के लिए मजबूर किया जाता है जो अस्पष्ट भविष्यवाणियों को चलाएगा, जो बदले में अपेक्षित व्यावसायिक प्रभाव का नेतृत्व नहीं करता है, विशेष रूप से ग्राहक सत्र जैसे असतत संदर्भों में। जब एप्लिकेशन को फिर से कॉन्फ़िगर किया जाता है या डेटा स्रोत विकसित होते हैं, तो वे आवश्यक घटनाओं के लिए अग्रणी होते हैं, जो सुविधाओं को नहीं खिलाते हैं, उन्हें भी अवगत नहीं कराया जा सकता है। जब मॉडल चुनने की बात आती है तो यह लापता डेटा बेख़बर निर्णय लेने की ओर जाता है। यह कम-सटीक भविष्यवाणी प्रदर्शन की ओर जाता है, या इससे भी बदतर, गलत डेटा का उपयोग करने वाले मॉडल गलत निर्णय ले सकते हैं।
अंत में, एकत्रीकरण मौजूदा सुविधाओं को बनाने पर केंद्रित है। नई सुविधा इंजीनियरिंग - मॉडल को चुनने और प्रशिक्षित करने के लिए आवश्यक प्रसंस्करण डेटा - विभिन्न एकत्रीकरणों के लिए कच्चे डेटा पर वापस जाने की आवश्यकता है। यह अतिरिक्त प्रसंस्करण प्रयोग प्रक्रिया को विस्तारित करते हुए, डेटा वैज्ञानिकों के काम को काफी धीमा कर देता है।
दूसरी चुनौती वर्तमान एमएल अवसंरचना से संबंधित है जो एआई पहलों को शक्ति प्रदान करती है और बड़े पैमाने पर डेटासेट को संसाधित करने में उनकी अक्षमता है। मॉडल की गुणवत्ता, और उनके परिणाम, अंतर्ग्रहण किए गए ईवेंट डेटा की मात्रा के साथ बढ़ते हैं। संगठनों को अक्सर बड़ी मात्रा में घटनाओं को संसाधित करने की आवश्यकता होती है, जो विरासत के बुनियादी ढांचे के साथ सामना नहीं कर सकते।
प्रशिक्षण मॉडल का क्रम और अनुमान चलाने के लिए उनकी सेवा करना जटिल हो जाता है, विशेष रूप से इसमें प्रत्येक के बीच डेटा आंदोलनों की आवश्यकता होती है। उच्च-गुणवत्ता की भविष्यवाणियों के लिए आवश्यक पैमाने को संभालने का प्रयास पारंपरिक आर्किटेक्चर को उनके ब्रेकिंग पॉइंट पर धकेलता है। यह श्रमसाध्य रूप से धीमा, अविश्वसनीय और महंगा भी है। यह सब उन ऐप्स के मूल्य और प्रभाव को खतरे में डालता है जो तेजी से मिशन के लिए महत्वपूर्ण हैं।
कोई महत्वपूर्ण प्रभाव डालने के लिए बहुत देर से डेटा संसाधित करने से एक और बाधा उत्पन्न होती है। वर्तमान आर्किटेक्चर को एक मॉडल की सेवा के लिए कई प्रणालियों के माध्यम से डेटा प्रोसेसिंग की आवश्यकता होती है, और यह विलंबता का परिचय देता है जो एआई पहल को विभिन्न तरीकों से प्रभावित करता है:
मॉडल का आउटपुट विकासशील स्थिति के पाठ्यक्रम को नहीं बदल सकता है। उदाहरण के लिए, जब रूपांतरण दर में गिरावट आई है, और ग्राहक ने कुछ और खरीदा हो, तो यह एक ग्राहक प्रस्ताव का प्रस्ताव करता है।
मॉडलों की सेवा करने और परिणाम प्राप्त करने में लगने वाला समय डिजिटल अनुभव या स्वचालित प्रक्रिया की अपेक्षाओं से मेल नहीं खाता। कभी-कभी, डेटा को प्रोसेस करने के लिए तैयार होने में कई दिन लग सकते हैं. अत्यधिक प्रतिस्पर्धी बाजारों में, यह पुराना डेटा अप्रासंगिक है, और सबसे खराब, खतरनाक है (संकट या आपदा के दौरान सर्ज प्राइसिंग लागू करने वाले राइड-शेयरिंग ऐप पर विचार करें)।
डेटा वैज्ञानिकों के पास नवीनतम डेटा तक पहुंच नहीं है। यह मॉडल के परिणाम को प्रभावित कर सकता है और डेटा वैज्ञानिकों को अतिरिक्त डेटा बिंदुओं या स्रोतों की तलाश में मूल्यवान समय बिताने की आवश्यकता हो सकती है।
कई मौजूदा एमएल इन्फ्रास्ट्रक्चर अनुप्रयोगों की सेवा नहीं कर सकते क्योंकि वे बहुत महंगे, बहुत जटिल और बहुत धीमे हैं। और, विनियामक परिवर्तनों को अंततः संगठनों को अधिक विस्तृत स्पष्टीकरण प्रदान करने की आवश्यकता हो सकती है कि मॉडल कैसे प्रशिक्षित किए गए और वे किसी विशेष निर्णय पर क्यों पहुंचे। प्रसंस्करण, एकत्रीकरण और शामिल उपकरणों की विविधता के कारण वर्तमान आर्किटेक्चर के साथ दृश्यता का यह स्तर असंभव है।
कई इन्फ्रास्ट्रक्चर के साथ समस्या उस यात्रा में निहित है जो डेटा को एआई-संचालित एप्लिकेशन तक ले जानी चाहिए। सीधे शब्दों में कहें तो समस्या का उत्तर इसके विपरीत करना है।
इस लेख की शुरुआत में जिन कंपनियों का उल्लेख किया गया है, जैसे नेता ग्राहकों, उपकरणों, सेंसर या भागीदारों से बड़े पैमाने पर वास्तविक समय के डेटा को एकत्र करके सफल होते हैं, क्योंकि यह उनके अनुप्रयोगों के माध्यम से आगे बढ़ता है। यह डेटा बदले में उनके मॉडलों को प्रशिक्षित करने और सेवा देने के लिए उपयोग किया जाता है। ये कंपनियां इस समय इस डेटा पर काम करती हैं, रीयल टाइम में लाखों ग्राहकों को सेवा प्रदान करती हैं।
नेताओं की सफलता का एक और महत्वपूर्ण तथ्य यह है कि वे सभी डेटा को सबसे बारीक स्तर पर एकत्र करते हैं - समय-मुद्रांकित घटनाओं के रूप में। इसका मतलब है कि उनके पास बहुत सारा डेटा नहीं है; वे यह भी समझ सकते हैं कि समय के साथ क्या हुआ और कब हुआ।
नेटफ्लिक्स, फेडएक्स और उबेर जैसे अग्रणी उद्यम "जहां डेटा है, वहां एआई लाते हैं" ताकि वे उस जगह पर निष्कर्ष दे सकें जहां एप्लिकेशन रहता है। दूसरे शब्दों में, वे अपने एमएल मॉडल को अपने अनुप्रयोगों में एम्बेड करते हैं, स्ट्रीमिंग सेवाओं के माध्यम से वास्तविक समय में घटनाओं को एकत्र करते हैं और इस डेटा को एमएल मॉडल में उजागर करते हैं। और उनके पास एक डेटाबेस है (ऊपर उल्लिखित तीन नेताओं के मामले में, यह उच्च-थ्रूपुट, ओपन सोर्स नोएसक्यूएल डेटाबेस है
सही एकीकृत डेटा प्लेटफॉर्म के साथ, एमएल पहल के पास सही बुनियादी ढांचा और सही डेटा है। डेटा इंजीनियर और डेटा वैज्ञानिक "अपने साइलो से बाहर निकल सकते हैं" और फीचर इंजीनियरिंग, मॉडल प्रयोग, प्रशिक्षण और शक्ति भविष्यवाणियों के अनुमान की अपनी प्रक्रियाओं को संरेखित कर सकते हैं। जबकि इन प्रक्रियाओं के लिए अभी भी कई उपकरणों की आवश्यकता होती है, वे सभी एक ही डेटा फाउंडेशन पर काम करते हैं।
मॉडल और एप्लिकेशन की सेवा के लिए भारी मात्रा में ईवेंट डेटा द्वारा संचालित, एआई द्वारा संचालित सबसे सफल एप्लिकेशन अंतिम उपयोगकर्ताओं को प्रदान किए जाने वाले अनुभवों में लगातार सुधार करके अंतर करते हैं और नेतृत्व करते हैं। लाखों ग्राहकों की सेवा करने की उनकी क्षमता, और जैसे-जैसे वे स्मार्ट होते जाते हैं, उन्हें उन बाज़ारों को परिभाषित करने में सक्षम बनाते हैं जिनमें वे हैं।
जानें कि कैसे DataStax रीयल-टाइम AI को सक्षम बनाता है
एड अनफ द्वारा।
Ed DataStax में मुख्य उत्पाद अधिकारी हैं। उनके पास Google, Apigee, Six Apart, Vignette, Epicentric, और Wired जैसी कंपनियों में प्रोडक्ट और टेक्नोलॉजी लीडर के रूप में 25 से अधिक वर्षों का अनुभव है।
यहाँ भी प्रकाशित हुआ।