बड़े भाषा मॉडल आज बेहद शक्तिशाली हो गए हैं; वे हमारे कुछ कठिन प्रश्नों के उत्तर प्रदान करने में सहायता कर सकते हैं। लेकिन वे हमें भटका भी सकते हैं: वे मतिभ्रम करते हैं, जिसका अर्थ है कि वे ऐसे उत्तर देते हैं जो सही लगते हैं, लेकिन होते नहीं हैं।
यहां, हम एलएलएम को मतिभ्रम से रोकने के लिए तीन तरीकों पर गौर करेंगे: पुनर्प्राप्ति-संवर्धित पीढ़ी (आरएजी), तर्क, और पुनरावृत्त क्वेरी।
साथ
एक बार प्रासंगिक दस्तावेज़ पुनर्प्राप्त हो जाने के बाद, इन दस्तावेज़ों के साथ क्वेरी का उपयोग एलएलएम द्वारा उपयोगकर्ता के लिए प्रतिक्रिया को सारांशित करने के लिए किया जाता है। इस तरह, मॉडल को केवल अपने आंतरिक ज्ञान पर निर्भर नहीं रहना पड़ता है, बल्कि आप उसे जो भी डेटा प्रदान करते हैं, वह सही समय पर उस तक पहुंच सकता है। एक तरह से, यह एलएलएम को "दीर्घकालिक स्मृति" प्रदान करता है जो उसके पास नहीं होती है। मॉडल वेक्टर डेटाबेस में संग्रहीत मालिकाना डेटा को शामिल करके अधिक सटीक और प्रासंगिक रूप से उपयुक्त प्रतिक्रियाएँ प्रदान कर सकता है।
एक वैकल्पिक आरएजी दृष्टिकोण में तथ्य जाँच शामिल है। एलएलएम को उत्तर के लिए कहा जाता है, जिसके बाद वेक्टर डेटाबेस में डेटा के आधार पर तथ्यों की जांच की जाती है और समीक्षा की जाती है। क्वेरी का उत्तर वेक्टर डेटाबेस से तैयार किया जाता है, और फिर एलएलएम उस उत्तर को यह समझने के लिए एक संकेत के रूप में उपयोग करता है कि क्या यह किसी तथ्य से संबंधित है।
एलएलएम कई चीज़ों में बहुत अच्छे हैं। वे एक वाक्य में अगले शब्द की भविष्यवाणी कर सकते हैं, "ट्रांसफॉर्मर" में प्रगति के लिए धन्यवाद, जो इनपुट डेटा के विभिन्न हिस्सों पर अलग-अलग ध्यान देकर मशीनें मानव भाषा को समझने के तरीके को बदल देती हैं। एलएलएम बहुत सारी जानकारी को एक बहुत ही संक्षिप्त उत्तर में बदलने और बड़ी मात्रा में पाठ से जो कुछ आप खोज रहे हैं उसे ढूंढने और निकालने में भी अच्छे हैं। आश्चर्यजनक रूप से, एलएलएमएस भी योजना बना सकते हैं - वे वस्तुतः डेटा एकत्र कर सकते हैं और आपके लिए यात्रा की योजना बना सकते हैं।
और शायद इससे भी अधिक आश्चर्य की बात यह है कि एलएलएम उत्तर देने के लिए तर्क का उपयोग लगभग मानव की तरह कर सकते हैं। क्योंकि लोग तर्क कर सकते हैं, उन्हें भविष्यवाणी या निर्णय लेने के लिए ढेर सारे डेटा की आवश्यकता नहीं होती है। रीजनिंग एलएलएम को मतिभ्रम से बचने में भी मदद करती है। इसका एक उदाहरण है "
यह विधि मॉडलों को बहु-चरणीय समस्याओं को मध्यवर्ती चरणों में तोड़ने में मदद करती है। चेन-ऑफ़-थॉट प्रॉम्प्टिंग के साथ, एलएलएम जटिल तर्क समस्याओं को हल कर सकते हैं जो मानक प्रॉम्प्ट विधियां नहीं कर सकती हैं (गहराई से देखने के लिए, ब्लॉग पोस्ट देखें)
यदि आप एलएलएम को एक जटिल गणित समस्या देते हैं, तो वह गलत हो सकती है। लेकिन यदि आप एलएलएम को समस्या के साथ-साथ उसे हल करने की विधि भी प्रदान करते हैं, तो यह एक सटीक उत्तर दे सकता है - और उत्तर के पीछे का कारण साझा कर सकता है। एक वेक्टर डेटाबेस इस पद्धति का एक महत्वपूर्ण हिस्सा है, क्योंकि यह इसके समान प्रश्नों के उदाहरण प्रदान करता है और उदाहरण के साथ संकेत भरता है।
इससे भी बेहतर, एक बार जब आपके पास प्रश्न और उत्तर हो, तो आप अपने जेनरेटिव एआई अनुप्रयोगों की सटीकता और उपयोगिता को और बेहतर बनाने के लिए इसे वेक्टर डेटाबेस में वापस संग्रहीत कर सकते हैं।
इनमें कई अन्य तार्किक प्रगतियां भी शामिल हैं जिनके बारे में आप सीख सकते हैं
एलएलएम मतिभ्रम को कम करने में मदद करने वाली तीसरी विधि इंटरैक्टिव क्वेरी है। इस मामले में, एक एआई एजेंट उन कॉलों की मध्यस्थता करता है जो एलएलएम और वेक्टर डेटाबेस के बीच आगे और पीछे चलती हैं। सर्वोत्तम उत्तर पर पहुंचने के लिए, ऐसा कई बार पुनरावृत्त रूप से हो सकता है। इस अग्रगामी सक्रिय पुनर्प्राप्ति पीढ़ी का एक उदाहरण, जिसे फ़्लेयर के नाम से भी जाना जाता है।
आप एक प्रश्न लें, इसी तरह के और अधिक प्रश्नों के लिए अपने ज्ञान के आधार पर प्रश्न पूछें। आपको इसी तरह के प्रश्नों की एक श्रृंखला मिलेगी। फिर आप सभी प्रश्नों के साथ वेक्टर डेटाबेस से पूछताछ करते हैं, उत्तर को सारांशित करते हैं, और जांचते हैं कि उत्तर अच्छा और उचित लगता है या नहीं। यदि ऐसा नहीं होता है, तो चरणों को तब तक दोहराएँ जब तक ऐसा न हो जाए।
अन्य उन्नत इंटरैक्टिव क्वेरी विधियों में शामिल हैं
ऐसे कई उपकरण हैं जो एजेंट ऑर्केस्ट्रेशन में आपकी सहायता कर सकते हैं।
ऐसा ही एक और टूल है
कंपनी "कितने निवासी वर्तमान में मेडिकेयर पर हैं?" जैसे संकेतों के लिए एआई-जनित उत्तर प्रदान करने के लिए संरचित और असंरचित दोनों प्रकार के डेटा का उपयोग करती है। स्काईप्वाइंट के सीईओ टिसन मैथ्यू ने मुझे हाल ही में बताया। उन्होंने कहा, इससे देखभाल प्रदाताओं को सटीक डेटा के आधार पर तुरंत सूचित निर्णय लेने में मदद मिलती है।
हालाँकि, उस बिंदु तक पहुँचना एक प्रक्रिया थी, मैथ्यू ने कहा। उनकी टीम ने एक मानक एलएलएम लेकर और स्काईप्वाइंट डेटा के साथ इसे ठीक करके शुरुआत की। उन्होंने कहा, "इसके विनाशकारी परिणाम सामने आए - यादृच्छिक शब्द भी।" संकेतों को समझना और बनाना कुछ ऐसा था जिसे स्काईप्वाइंट संभाल सकता था, लेकिन बड़े पैमाने पर सटीक उत्तर उत्पन्न करने के लिए इसे एआई प्रौद्योगिकी स्टैक की आवश्यकता थी।
उदाहरण के लिए, स्काईप्वाइंट ने एक ऐसी प्रणाली का निर्माण किया जो ऑपरेटरों और प्रदाताओं से संरचित डेटा को शामिल करता है, जिसमें इलेक्ट्रॉनिक हेल्थकेयर रिकॉर्ड और पेरोल डेटा भी शामिल है। इसे एक स्तंभ डेटाबेस में संग्रहीत किया जाता है; इसे क्वेरी करने के लिए RAG का उपयोग किया जाता है। असंरचित डेटा, जैसे नीतियां और प्रक्रियाएं और राज्य नियम, एक वेक्टर डेटाबेस में संग्रहीत होते हैं:
टिसन ने एक उदाहरण के रूप में एक प्रश्न प्रस्तुत किया: यदि कोई निवासी दुर्व्यवहार करने लगे तो क्या होगा? एस्ट्रा डीबी एक उत्तर प्रदान करता है जो राज्य के नियमों और उपयोगकर्ताओं के संदर्भ और विभिन्न दस्तावेजों के आधार पर तैयार किया गया है
टिसन ने कहा, "ये विशिष्ट उत्तर हैं जिनका सही होना जरूरी है।" "यह वह जानकारी है जिस पर एक संगठन अपने समुदाय और अपने व्यवसाय के लिए सूचित निर्णय लेने के लिए भरोसा करता है।"
स्काईप्वाइंट एआई एआई मतिभ्रम के जोखिम को कम करने के महत्व को दर्शाता है; सटीक उत्तर सुनिश्चित करने के लिए उपलब्ध तरीकों और उपकरणों के बिना परिणाम संभावित रूप से गंभीर हो सकते हैं।
आरएजी, तर्क और फ़्लेयर जैसे पुनरावृत्त क्वेरी दृष्टिकोण के साथ, जेनरेटिव एआई - विशेष रूप से जब मालिकाना डेटा द्वारा ईंधन दिया जाता है - उद्यमों को अपने ग्राहकों को कुशलतापूर्वक और प्रभावी ढंग से सेवा देने में मदद करने के लिए एक तेजी से शक्तिशाली उपकरण बन रहा है।
एलन हो द्वारा, डेटास्टैक्स
इस बारे में और जानें कि डेटास्टैक्स आपकी कैसे मदद करता है
यहाँ भी प्रकाशित किया गया है.