paint-brush
एआई की इतनी सारी पहल क्यों विफल हो जाती हैंद्वारा@datastax
1,254 रीडिंग
1,254 रीडिंग

एआई की इतनी सारी पहल क्यों विफल हो जाती हैं

द्वारा DataStax6m2023/04/26
Read on Terminal Reader

बहुत लंबा; पढ़ने के लिए

ऐसा क्यों है कि, अधिकांश संगठनों के लिए, सफल AI एप्लिकेशन बनाना एक बड़ी चुनौती है? इसे तीन बड़ी बाधाओं तक उबाला जा सकता है: गलत डेटा, गलत बुनियादी ढांचे में, गलत समय पर।
featured image - एआई की इतनी सारी पहल क्यों विफल हो जाती हैं
DataStax HackerNoon profile picture
0-item

आप अपने iPhone पर अपने दोस्त की एक खास तस्वीर ढूंढ रहे हैं, जो कुछ साल पहले ली गई थी। खोज करने के लिए हजारों छवियां हैं, लेकिन ऐप्पल फोटो ऐप सही व्यक्ति पर शून्य करता है, और प्रेस्टो, सेकंड के भीतर आपको वह चित्र मिल जाता है जिसे आप ढूंढ रहे हैं।


ऐसा करने के लिए पर्दे के पीछे बहुत काम है, जिसमें चेहरे की पहचान और छवि विश्लेषण और स्वचालित टैगिंग शामिल है, जो आवश्यक या वांछित है, और फिर वास्तविक समय में उन संदर्भों पर कार्य करके प्रयास को बचाने के लिए एक साथ आना।


Apple - और Google, FedEx, Uber, Netflix जैसी कंपनियों ने भी - सिस्टम और आर्किटेक्चर बनाने में वर्षों बिताए हैं जो उपयोगकर्ता के अनुभवों को आसान, अधिक व्यक्तिगत और अधिक सहज बनाने में सक्षम बनाते हैं। कुछ मामलों में, आर्टिफिशियल इंटेलिजेंस प्रमुख निर्णयों को लगभग तुरंत किए जाने या वास्तविक समय में होने वाली भविष्यवाणियों को सक्षम बनाता है, जो किसी व्यवसाय को पल में परिणामों में सुधार करने के लिए सशक्त बनाता है।


यह उद्यमों के व्यापक ब्रह्मांड पर खो नहीं गया है: ए के अनुसार 2022 डेलॉइट सर्वेक्षण , 94% बिजनेस लीडर्स का कहना है कि एआई सफलता के लिए महत्वपूर्ण है।


तो ऐसा क्यों है कि, अधिकांश संगठनों के लिए, सफल AI एप्लिकेशन बनाना एक बड़ी चुनौती है? इसे तीन बड़ी बाधाओं तक उबाला जा सकता है: गलत डेटा, गलत बुनियादी ढांचे में, गलत समय पर।

एआई सफलता के लिए बाधाएं

मैकिन्से के अनुसार , 56% कंपनियों ने AI को अपनाया है, लेकिन, जैसा कि Accenture ने a प्रतिवेदन केवल 12% एआई के साथ बेहतर विकास और व्यापार परिवर्तन प्राप्त करने में सफल होते हैं।


एआई को वास्तविक समय के अनुप्रयोगों में सफलतापूर्वक बनाने के रास्ते में कई बाधाएं खड़ी होती हैं, लेकिन अधिकांश एक केंद्रीय तत्व से संबंधित हैं: डेटा।


कई पारंपरिक ML/AI सिस्टम, और उनके द्वारा उत्पन्न परिणाम, डेटा वेयरहाउस और बैच प्रोसेसिंग पर निर्भर करते हैं। परिणाम: इस ऐतिहासिक डेटा को मशीन लर्निंग सिस्टम में "लाने" के लिए प्रौद्योगिकियों, डेटा आंदोलनों और परिवर्तनों की एक जटिल सरणी की आवश्यकता होती है।


एमएल मॉडल में डाले गए डेटा को फीचर कहा जाता है (मापने योग्य गुण जो विश्लेषण के लिए उपयोग किए जा सकते हैं), जो आम तौर पर एक एप्लिकेशन डेटाबेस में संग्रहीत डेटा पर आधारित होते हैं या लॉग फ़ाइलों में लिखे जाते हैं। उन्हें अक्सर परिवर्तनों की आवश्यकता होती है, जैसे स्केलिंग मान या पूर्व रिकॉर्ड के आधार पर संगणना (उदाहरण के लिए, एक रिकॉर्ड उत्पन्न होने के समय चलती औसत)।


यह आम तौर पर इनपुट से लेकर आउटपुट तक के डेटा के प्रवाह को धीमा कर देता है, जिसके परिणामस्वरूप छूटे हुए अवसर होते हैं, जिसके परिणामस्वरूप ग्राहक मंथन हो सकता है, या मान्यता प्राप्त साइबर सुरक्षा खतरे के पैटर्न का पता नहीं चल पाता है। चुनौतियों को अनुचित डेटासेट के रूप में अभिव्यक्त किया जा सकता है, जो गलत तरीके से चलने वाले बुनियादी ढाँचे द्वारा समर्थित है जो बहुत धीरे-धीरे चलता है।

गलत आंकड़े...

डेटा की भारी मात्रा (और संबंधित लागत) के कारण, इसे परिवहन और उपलब्धता में आसानी के लिए एकत्रित किया जाना है। सीधे शब्दों में कहें, जो डेटा एकत्र या अत्यधिक रूपांतरित होता है, वह संगठनों को वास्तविक समय में उचित कार्यों की आसानी से पहचान करने से रोकता है और पसंदीदा परिणाम प्राप्त करने की संभावना को कम करता है, चाहे वह सुझाया गया उत्पाद हो, अद्यतन पैकेज वितरण मार्ग हो या कारखाने में मशीन पर समायोजित सेटिंग हो। . यह नए सवालों के जवाब खोजने, परिणामों की भविष्यवाणी करने या तेजी से विकसित होने वाले संदर्भ के अनुकूल होने के लिए संगठन की क्षमता को धीमा कर देता है।


डेटा वैज्ञानिकों को मोटे अनाज वाले डेटासेट का उपयोग करने के लिए मजबूर किया जाता है जो अस्पष्ट भविष्यवाणियों को चलाएगा, जो बदले में अपेक्षित व्यावसायिक प्रभाव का नेतृत्व नहीं करता है, विशेष रूप से ग्राहक सत्र जैसे असतत संदर्भों में। जब एप्लिकेशन को फिर से कॉन्फ़िगर किया जाता है या डेटा स्रोत विकसित होते हैं, तो वे आवश्यक घटनाओं के लिए अग्रणी होते हैं, जो सुविधाओं को नहीं खिलाते हैं, उन्हें भी अवगत नहीं कराया जा सकता है। जब मॉडल चुनने की बात आती है तो यह लापता डेटा बेख़बर निर्णय लेने की ओर जाता है। यह कम-सटीक भविष्यवाणी प्रदर्शन की ओर जाता है, या इससे भी बदतर, गलत डेटा का उपयोग करने वाले मॉडल गलत निर्णय ले सकते हैं।


अंत में, एकत्रीकरण मौजूदा सुविधाओं को बनाने पर केंद्रित है। नई सुविधा इंजीनियरिंग - मॉडल को चुनने और प्रशिक्षित करने के लिए आवश्यक प्रसंस्करण डेटा - विभिन्न एकत्रीकरणों के लिए कच्चे डेटा पर वापस जाने की आवश्यकता है। यह अतिरिक्त प्रसंस्करण प्रयोग प्रक्रिया को विस्तारित करते हुए, डेटा वैज्ञानिकों के काम को काफी धीमा कर देता है।

…गलत इंफ्रास्ट्रक्चर में…

दूसरी चुनौती वर्तमान एमएल अवसंरचना से संबंधित है जो एआई पहलों को शक्ति प्रदान करती है और बड़े पैमाने पर डेटासेट को संसाधित करने में उनकी अक्षमता है। मॉडल की गुणवत्ता, और उनके परिणाम, अंतर्ग्रहण किए गए ईवेंट डेटा की मात्रा के साथ बढ़ते हैं। संगठनों को अक्सर बड़ी मात्रा में घटनाओं को संसाधित करने की आवश्यकता होती है, जो विरासत के बुनियादी ढांचे के साथ सामना नहीं कर सकते।


प्रशिक्षण मॉडल का क्रम और अनुमान चलाने के लिए उनकी सेवा करना जटिल हो जाता है, विशेष रूप से इसमें प्रत्येक के बीच डेटा आंदोलनों की आवश्यकता होती है। उच्च-गुणवत्ता की भविष्यवाणियों के लिए आवश्यक पैमाने को संभालने का प्रयास पारंपरिक आर्किटेक्चर को उनके ब्रेकिंग पॉइंट पर धकेलता है। यह श्रमसाध्य रूप से धीमा, अविश्वसनीय और महंगा भी है। यह सब उन ऐप्स के मूल्य और प्रभाव को खतरे में डालता है जो तेजी से मिशन के लिए महत्वपूर्ण हैं।

… गलत समय पर

कोई महत्वपूर्ण प्रभाव डालने के लिए बहुत देर से डेटा संसाधित करने से एक और बाधा उत्पन्न होती है। वर्तमान आर्किटेक्चर को एक मॉडल की सेवा के लिए कई प्रणालियों के माध्यम से डेटा प्रोसेसिंग की आवश्यकता होती है, और यह विलंबता का परिचय देता है जो एआई पहल को विभिन्न तरीकों से प्रभावित करता है:


  • मॉडल का आउटपुट विकासशील स्थिति के पाठ्यक्रम को नहीं बदल सकता है। उदाहरण के लिए, जब रूपांतरण दर में गिरावट आई है, और ग्राहक ने कुछ और खरीदा हो, तो यह एक ग्राहक प्रस्ताव का प्रस्ताव करता है।

  • मॉडलों की सेवा करने और परिणाम प्राप्त करने में लगने वाला समय डिजिटल अनुभव या स्वचालित प्रक्रिया की अपेक्षाओं से मेल नहीं खाता। कभी-कभी, डेटा को प्रोसेस करने के लिए तैयार होने में कई दिन लग सकते हैं. अत्यधिक प्रतिस्पर्धी बाजारों में, यह पुराना डेटा अप्रासंगिक है, और सबसे खराब, खतरनाक है (संकट या आपदा के दौरान सर्ज प्राइसिंग लागू करने वाले राइड-शेयरिंग ऐप पर विचार करें)।

  • डेटा वैज्ञानिकों के पास नवीनतम डेटा तक पहुंच नहीं है। यह मॉडल के परिणाम को प्रभावित कर सकता है और डेटा वैज्ञानिकों को अतिरिक्त डेटा बिंदुओं या स्रोतों की तलाश में मूल्यवान समय बिताने की आवश्यकता हो सकती है।


कई मौजूदा एमएल इन्फ्रास्ट्रक्चर अनुप्रयोगों की सेवा नहीं कर सकते क्योंकि वे बहुत महंगे, बहुत जटिल और बहुत धीमे हैं। और, विनियामक परिवर्तनों को अंततः संगठनों को अधिक विस्तृत स्पष्टीकरण प्रदान करने की आवश्यकता हो सकती है कि मॉडल कैसे प्रशिक्षित किए गए और वे किसी विशेष निर्णय पर क्यों पहुंचे। प्रसंस्करण, एकत्रीकरण और शामिल उपकरणों की विविधता के कारण वर्तमान आर्किटेक्चर के साथ दृश्यता का यह स्तर असंभव है।


कई इन्फ्रास्ट्रक्चर के साथ समस्या उस यात्रा में निहित है जो डेटा को एआई-संचालित एप्लिकेशन तक ले जानी चाहिए। सीधे शब्दों में कहें तो समस्या का उत्तर इसके विपरीत करना है।

एआई को डेटा में लाना

इस लेख की शुरुआत में जिन कंपनियों का उल्लेख किया गया है, जैसे नेता ग्राहकों, उपकरणों, सेंसर या भागीदारों से बड़े पैमाने पर वास्तविक समय के डेटा को एकत्र करके सफल होते हैं, क्योंकि यह उनके अनुप्रयोगों के माध्यम से आगे बढ़ता है। यह डेटा बदले में उनके मॉडलों को प्रशिक्षित करने और सेवा देने के लिए उपयोग किया जाता है। ये कंपनियां इस समय इस डेटा पर काम करती हैं, रीयल टाइम में लाखों ग्राहकों को सेवा प्रदान करती हैं।


नेताओं की सफलता का एक और महत्वपूर्ण तथ्य यह है कि वे सभी डेटा को सबसे बारीक स्तर पर एकत्र करते हैं - समय-मुद्रांकित घटनाओं के रूप में। इसका मतलब है कि उनके पास बहुत सारा डेटा नहीं है; वे यह भी समझ सकते हैं कि समय के साथ क्या हुआ और कब हुआ।


नेटफ्लिक्स, फेडएक्स और उबेर जैसे अग्रणी उद्यम "जहां डेटा है, वहां एआई लाते हैं" ताकि वे उस जगह पर निष्कर्ष दे सकें जहां एप्लिकेशन रहता है। दूसरे शब्दों में, वे अपने एमएल मॉडल को अपने अनुप्रयोगों में एम्बेड करते हैं, स्ट्रीमिंग सेवाओं के माध्यम से वास्तविक समय में घटनाओं को एकत्र करते हैं और इस डेटा को एमएल मॉडल में उजागर करते हैं। और उनके पास एक डेटाबेस है (ऊपर उल्लिखित तीन नेताओं के मामले में, यह उच्च-थ्रूपुट, ओपन सोर्स नोएसक्यूएल डेटाबेस है अपाचे कैसेंड्रा ) जो भारी मात्रा में ईवेंट डेटा संग्रहीत कर सकता है।


सही एकीकृत डेटा प्लेटफॉर्म के साथ, एमएल पहल के पास सही बुनियादी ढांचा और सही डेटा है। डेटा इंजीनियर और डेटा वैज्ञानिक "अपने साइलो से बाहर निकल सकते हैं" और फीचर इंजीनियरिंग, मॉडल प्रयोग, प्रशिक्षण और शक्ति भविष्यवाणियों के अनुमान की अपनी प्रक्रियाओं को संरेखित कर सकते हैं। जबकि इन प्रक्रियाओं के लिए अभी भी कई उपकरणों की आवश्यकता होती है, वे सभी एक ही डेटा फाउंडेशन पर काम करते हैं।


मॉडल और एप्लिकेशन की सेवा के लिए भारी मात्रा में ईवेंट डेटा द्वारा संचालित, एआई द्वारा संचालित सबसे सफल एप्लिकेशन अंतिम उपयोगकर्ताओं को प्रदान किए जाने वाले अनुभवों में लगातार सुधार करके अंतर करते हैं और नेतृत्व करते हैं। लाखों ग्राहकों की सेवा करने की उनकी क्षमता, और जैसे-जैसे वे स्मार्ट होते जाते हैं, उन्हें उन बाज़ारों को परिभाषित करने में सक्षम बनाते हैं जिनमें वे हैं।


जानें कि कैसे DataStax रीयल-टाइम AI को सक्षम बनाता है



एड अनफ द्वारा।


Ed DataStax में मुख्य उत्पाद अधिकारी हैं। उनके पास Google, Apigee, Six Apart, Vignette, Epicentric, और Wired जैसी कंपनियों में प्रोडक्ट और टेक्नोलॉजी लीडर के रूप में 25 से अधिक वर्षों का अनुभव है।



यहाँ भी प्रकाशित हुआ।