paint-brush
क्या AI मतिभ्रम को रोका जा सकता है? ऐसा करने के 3 तरीकों पर एक नज़रद्वारा@datastax
3,083 रीडिंग
3,083 रीडिंग

क्या AI मतिभ्रम को रोका जा सकता है? ऐसा करने के 3 तरीकों पर एक नज़र

द्वारा DataStax6m2023/10/19
Read on Terminal Reader

बहुत लंबा; पढ़ने के लिए

एलएलएम को मतिभ्रम से रोकने के लिए तीन तरीकों की जांच: पुनर्प्राप्ति-संवर्धित पीढ़ी (आरएजी), तर्क, और पुनरावृत्त क्वेरी।
featured image - क्या AI मतिभ्रम को रोका जा सकता है? ऐसा करने के 3 तरीकों पर एक नज़र
DataStax HackerNoon profile picture


बड़े भाषा मॉडल आज बेहद शक्तिशाली हो गए हैं; वे हमारे कुछ कठिन प्रश्नों के उत्तर प्रदान करने में सहायता कर सकते हैं। लेकिन वे हमें भटका भी सकते हैं: वे मतिभ्रम करते हैं, जिसका अर्थ है कि वे ऐसे उत्तर देते हैं जो सही लगते हैं, लेकिन होते नहीं हैं।


एलएलएम जब उन्हें ऐसे प्रश्नों का सामना करना पड़ता है जो उनके प्रशिक्षण डेटा सेट का हिस्सा नहीं हैं - या जब उनके प्रशिक्षण डेटा सेट में गलत जानकारी होती है, तो वे भ्रमित हो जाते हैं (ऐसा तब हो सकता है जब एलएलएम को इंटरनेट डेटा पर प्रशिक्षित किया जाता है, जैसा कि हम सभी जानते हैं, हमेशा भरोसा नहीं किया जा सकता है) ). एलएलएम में भी मेमोरी नहीं होती। अंत में, "फाइन-ट्यूनिंग" को अक्सर नए डेटा पर एक मॉडल को फिर से प्रशिक्षित करके मतिभ्रम को कम करने का एक तरीका माना जाता है - लेकिन इसकी कमियां हैं।


यहां, हम एलएलएम को मतिभ्रम से रोकने के लिए तीन तरीकों पर गौर करेंगे: पुनर्प्राप्ति-संवर्धित पीढ़ी (आरएजी), तर्क, और पुनरावृत्त क्वेरी।

पुनर्प्राप्ति-संवर्धित पीढ़ी

साथ खपरैल , एक प्रश्न ज्ञानकोष में आता है (जो, इस मामले में, एक है वेक्टर डेटाबेस ) एक सिमेंटिक वेक्टर के रूप में - संख्याओं की एक स्ट्रिंग। फिर मॉडल डेटाबेस का उपयोग करके समान दस्तावेज़ पुनर्प्राप्त करता है वेक्टर खोज , उन दस्तावेज़ों की तलाश कर रहा है जिनके वेक्टर क्वेरी के वेक्टर के करीब हैं।


एक बार प्रासंगिक दस्तावेज़ पुनर्प्राप्त हो जाने के बाद, इन दस्तावेज़ों के साथ क्वेरी का उपयोग एलएलएम द्वारा उपयोगकर्ता के लिए प्रतिक्रिया को सारांशित करने के लिए किया जाता है। इस तरह, मॉडल को केवल अपने आंतरिक ज्ञान पर निर्भर नहीं रहना पड़ता है, बल्कि आप उसे जो भी डेटा प्रदान करते हैं, वह सही समय पर उस तक पहुंच सकता है। एक तरह से, यह एलएलएम को "दीर्घकालिक स्मृति" प्रदान करता है जो उसके पास नहीं होती है। मॉडल वेक्टर डेटाबेस में संग्रहीत मालिकाना डेटा को शामिल करके अधिक सटीक और प्रासंगिक रूप से उपयुक्त प्रतिक्रियाएँ प्रदान कर सकता है।


ज्ञान क्वेरी जनरेशन


एक वैकल्पिक आरएजी दृष्टिकोण में तथ्य जाँच शामिल है। एलएलएम को उत्तर के लिए कहा जाता है, जिसके बाद वेक्टर डेटाबेस में डेटा के आधार पर तथ्यों की जांच की जाती है और समीक्षा की जाती है। क्वेरी का उत्तर वेक्टर डेटाबेस से तैयार किया जाता है, और फिर एलएलएम उस उत्तर को यह समझने के लिए एक संकेत के रूप में उपयोग करता है कि क्या यह किसी तथ्य से संबंधित है।


तथ्य जांच को शामिल करना

तर्क

एलएलएम कई चीज़ों में बहुत अच्छे हैं। वे एक वाक्य में अगले शब्द की भविष्यवाणी कर सकते हैं, "ट्रांसफॉर्मर" में प्रगति के लिए धन्यवाद, जो इनपुट डेटा के विभिन्न हिस्सों पर अलग-अलग ध्यान देकर मशीनें मानव भाषा को समझने के तरीके को बदल देती हैं। एलएलएम बहुत सारी जानकारी को एक बहुत ही संक्षिप्त उत्तर में बदलने और बड़ी मात्रा में पाठ से जो कुछ आप खोज रहे हैं उसे ढूंढने और निकालने में भी अच्छे हैं। आश्चर्यजनक रूप से, एलएलएमएस भी योजना बना सकते हैं - वे वस्तुतः डेटा एकत्र कर सकते हैं और आपके लिए यात्रा की योजना बना सकते हैं।


और शायद इससे भी अधिक आश्चर्य की बात यह है कि एलएलएम उत्तर देने के लिए तर्क का उपयोग लगभग मानव की तरह कर सकते हैं। क्योंकि लोग तर्क कर सकते हैं, उन्हें भविष्यवाणी या निर्णय लेने के लिए ढेर सारे डेटा की आवश्यकता नहीं होती है। रीजनिंग एलएलएम को मतिभ्रम से बचने में भी मदद करती है। इसका एक उदाहरण है " विचार-श्रृंखला को प्रेरित करना ।”


यह विधि मॉडलों को बहु-चरणीय समस्याओं को मध्यवर्ती चरणों में तोड़ने में मदद करती है। चेन-ऑफ़-थॉट प्रॉम्प्टिंग के साथ, एलएलएम जटिल तर्क समस्याओं को हल कर सकते हैं जो मानक प्रॉम्प्ट विधियां नहीं कर सकती हैं (गहराई से देखने के लिए, ब्लॉग पोस्ट देखें) भाषा मॉडल विचार श्रृंखला के माध्यम से तर्क प्रस्तुत करते हैं गूगल से)।


यदि आप एलएलएम को एक जटिल गणित समस्या देते हैं, तो वह गलत हो सकती है। लेकिन यदि आप एलएलएम को समस्या के साथ-साथ उसे हल करने की विधि भी प्रदान करते हैं, तो यह एक सटीक उत्तर दे सकता है - और उत्तर के पीछे का कारण साझा कर सकता है। एक वेक्टर डेटाबेस इस पद्धति का एक महत्वपूर्ण हिस्सा है, क्योंकि यह इसके समान प्रश्नों के उदाहरण प्रदान करता है और उदाहरण के साथ संकेत भरता है।


इससे भी बेहतर, एक बार जब आपके पास प्रश्न और उत्तर हो, तो आप अपने जेनरेटिव एआई अनुप्रयोगों की सटीकता और उपयोगिता को और बेहतर बनाने के लिए इसे वेक्टर डेटाबेस में वापस संग्रहीत कर सकते हैं।


वेक्टर डेटाबेस में उत्तर संग्रहीत करना


इनमें कई अन्य तार्किक प्रगतियां भी शामिल हैं जिनके बारे में आप सीख सकते हैं विचार का वृक्ष , कम से कम से अधिक तक , आत्म स्थिरता , और अनुदेश ट्यूनिंग .

पुनरावृत्तीय पूछताछ

एलएलएम मतिभ्रम को कम करने में मदद करने वाली तीसरी विधि इंटरैक्टिव क्वेरी है। इस मामले में, एक एआई एजेंट उन कॉलों की मध्यस्थता करता है जो एलएलएम और वेक्टर डेटाबेस के बीच आगे और पीछे चलती हैं। सर्वोत्तम उत्तर पर पहुंचने के लिए, ऐसा कई बार पुनरावृत्त रूप से हो सकता है। इस अग्रगामी सक्रिय पुनर्प्राप्ति पीढ़ी का एक उदाहरण, जिसे फ़्लेयर के नाम से भी जाना जाता है।


आप एक प्रश्न लें, इसी तरह के और अधिक प्रश्नों के लिए अपने ज्ञान के आधार पर प्रश्न पूछें। आपको इसी तरह के प्रश्नों की एक श्रृंखला मिलेगी। फिर आप सभी प्रश्नों के साथ वेक्टर डेटाबेस से पूछताछ करते हैं, उत्तर को सारांशित करते हैं, और जांचते हैं कि उत्तर अच्छा और उचित लगता है या नहीं। यदि ऐसा नहीं होता है, तो चरणों को तब तक दोहराएँ जब तक ऐसा न हो जाए।


अग्रेषित सक्रिय पुनर्प्राप्ति पीढ़ी


अन्य उन्नत इंटरैक्टिव क्वेरी विधियों में शामिल हैं ऑटोजीपीटी , माइक्रोसॉफ्ट जार्विस , और एकल प्रदर्शन प्रेरक .


ऐसे कई उपकरण हैं जो एजेंट ऑर्केस्ट्रेशन में आपकी सहायता कर सकते हैं। लैंगचेन यह एक बेहतरीन उदाहरण है जो आपको एलएलएम और वेक्टर डेटाबेस के बीच कॉल व्यवस्थित करने में मदद करता है। यह अनिवार्य रूप से अधिकांश प्रबंधन कार्यों और एलएलएम के साथ इंटरैक्शन को स्वचालित करता है, और मेमोरी, वेक्टर-आधारित समानता खोज, उन्नत प्रॉम्प्ट टेम्प्लेटिंग एब्स्ट्रैक्शन और कई अन्य सुविधाओं के लिए समर्थन प्रदान करता है। यह चेन-ऑफ-थॉट और फ्लेयर जैसी उन्नत प्रोत्साहन तकनीकों की भी सहायता और समर्थन करता है।


ऐसा ही एक और टूल है केसियो , जिसे डेटास्टैक्स द्वारा हमारे एस्ट्रा डीबी वेक्टर डेटाबेस के शीर्ष पर एक अमूर्त के रूप में विकसित किया गया था, डेटा और मेमोरी को प्रथम श्रेणी-नागरिक बनाने के विचार के साथ जनरेटिव एआई . कैसियो एक पायथन लाइब्रेरी है जो डेटाबेस तक पहुंचने की प्रक्रिया को अमूर्त करके जेनेरिक आर्टिफिशियल इंटेलिजेंस और अन्य मशीन लर्निंग वर्कलोड के साथ कैसेंड्रा के एकीकरण को सहज बनाती है। वेक्टर खोज क्षमताएं, और उपयोग के लिए तैयार उपकरणों का एक सेट पेश करना जो अतिरिक्त कोड की आवश्यकता को कम करता है।

यह सब एक साथ रखना: स्काईप्वाइंट एआई

स्काईप्वाइंट एआई एक SaaS प्रदाता है जो वरिष्ठ देखभाल और जीवनयापन उद्योग के लिए डेटा, एनालिटिक्स और AI सेवाओं में विशेषज्ञता रखता है। कंपनी वरिष्ठ नागरिकों, देखभाल करने वालों और सॉफ्टवेयर सिस्टम के बीच प्राकृतिक और सहज बातचीत को सक्षम करने के लिए जेनरेटिव एआई का लाभ उठाती है। जटिल अनुप्रयोगों को सरल बनाकर और उपयोगकर्ता अनुभव को सुव्यवस्थित करके, स्काईप्वाइंट एआई वरिष्ठ नागरिकों और देखभाल करने वालों को सशक्त बनाता है जानकारी और अंतर्दृष्टि तक सहजता से पहुँचना, जो देखभाल को बढ़ाने में मदद करता है।


कंपनी "कितने निवासी वर्तमान में मेडिकेयर पर हैं?" जैसे संकेतों के लिए एआई-जनित उत्तर प्रदान करने के लिए संरचित और असंरचित दोनों प्रकार के डेटा का उपयोग करती है। स्काईप्वाइंट के सीईओ टिसन मैथ्यू ने मुझे हाल ही में बताया। उन्होंने कहा, इससे देखभाल प्रदाताओं को सटीक डेटा के आधार पर तुरंत सूचित निर्णय लेने में मदद मिलती है।


हालाँकि, उस बिंदु तक पहुँचना एक प्रक्रिया थी, मैथ्यू ने कहा। उनकी टीम ने एक मानक एलएलएम लेकर और स्काईप्वाइंट डेटा के साथ इसे ठीक करके शुरुआत की। उन्होंने कहा, "इसके विनाशकारी परिणाम सामने आए - यादृच्छिक शब्द भी।" संकेतों को समझना और बनाना कुछ ऐसा था जिसे स्काईप्वाइंट संभाल सकता था, लेकिन बड़े पैमाने पर सटीक उत्तर उत्पन्न करने के लिए इसे एआई प्रौद्योगिकी स्टैक की आवश्यकता थी।


उदाहरण के लिए, स्काईप्वाइंट ने एक ऐसी प्रणाली का निर्माण किया जो ऑपरेटरों और प्रदाताओं से संरचित डेटा को शामिल करता है, जिसमें इलेक्ट्रॉनिक हेल्थकेयर रिकॉर्ड और पेरोल डेटा भी शामिल है। इसे एक स्तंभ डेटाबेस में संग्रहीत किया जाता है; इसे क्वेरी करने के लिए RAG का उपयोग किया जाता है। असंरचित डेटा, जैसे नीतियां और प्रक्रियाएं और राज्य नियम, एक वेक्टर डेटाबेस में संग्रहीत होते हैं: डेटास्टैक्स एस्ट्रा डीबी .


टिसन ने एक उदाहरण के रूप में एक प्रश्न प्रस्तुत किया: यदि कोई निवासी दुर्व्यवहार करने लगे तो क्या होगा? एस्ट्रा डीबी एक उत्तर प्रदान करता है जो राज्य के नियमों और उपयोगकर्ताओं के संदर्भ और विभिन्न दस्तावेजों के आधार पर तैयार किया गया है वेक्टर एम्बेडिंग , प्राकृतिक भाषा में जिसे एक वरिष्ठ देखभाल सुविधा कार्यकर्ता के लिए समझना आसान है,


टिसन ने कहा, "ये विशिष्ट उत्तर हैं जिनका सही होना जरूरी है।" "यह वह जानकारी है जिस पर एक संगठन अपने समुदाय और अपने व्यवसाय के लिए सूचित निर्णय लेने के लिए भरोसा करता है।"

निष्कर्ष

स्काईप्वाइंट एआई एआई मतिभ्रम के जोखिम को कम करने के महत्व को दर्शाता है; सटीक उत्तर सुनिश्चित करने के लिए उपलब्ध तरीकों और उपकरणों के बिना परिणाम संभावित रूप से गंभीर हो सकते हैं।


आरएजी, तर्क और फ़्लेयर जैसे पुनरावृत्त क्वेरी दृष्टिकोण के साथ, जेनरेटिव एआई - विशेष रूप से जब मालिकाना डेटा द्वारा ईंधन दिया जाता है - उद्यमों को अपने ग्राहकों को कुशलतापूर्वक और प्रभावी ढंग से सेवा देने में मदद करने के लिए एक तेजी से शक्तिशाली उपकरण बन रहा है।


एलन हो द्वारा, डेटास्टैक्स

इस बारे में और जानें कि डेटास्टैक्स आपकी कैसे मदद करता है वास्तविक समय, जेनरेटिव एआई एप्लिकेशन बनाएं .


यहाँ भी प्रकाशित किया गया है.