paint-brush
सामान्य पुनर्प्राप्ति संवर्धित पीढ़ी चुनौतियों का समाधान करके प्रासंगिक एलएलएम प्रतिक्रियाएं प्राप्त करनाद्वारा@datastax
745 रीडिंग
745 रीडिंग

सामान्य पुनर्प्राप्ति संवर्धित पीढ़ी चुनौतियों का समाधान करके प्रासंगिक एलएलएम प्रतिक्रियाएं प्राप्त करना

द्वारा DataStax4m2024/01/16
Read on Terminal Reader

बहुत लंबा; पढ़ने के लिए

हम उन सामान्य समस्याओं पर गौर करते हैं जो आरएजी कार्यान्वयन और एलएलएम इंटरैक्शन के साथ उत्पन्न हो सकती हैं।
featured image - सामान्य पुनर्प्राप्ति संवर्धित पीढ़ी चुनौतियों का समाधान करके प्रासंगिक एलएलएम प्रतिक्रियाएं प्राप्त करना
DataStax HackerNoon profile picture
0-item
1-item


जेनेरिक एआई अनुप्रयोगों का विकास करना पुनर्प्राप्ति संवर्धित पीढ़ी (आरएजी) और वेक्टर डेटाबेस चुनौतीपूर्ण हो सकते हैं। आपको अक्सर आरएजी कार्यान्वयन की समस्या का निवारण करने की आवश्यकता होगी जो वेक्टर डेटाबेस पर निर्भर करते हैं ताकि यह सुनिश्चित हो सके कि प्रासंगिक संदर्भ पुनर्प्राप्त हो गया है; यह महत्वपूर्ण है, क्योंकि अधिक सटीक परिणाम प्रदान करने के लिए उस संदर्भ को एक बड़े भाषा मॉडल के संकेत में शामिल किया जाता है।


इस श्रृंखला के पिछले लेख में, हमने एम्बेडिंग पाइपलाइन को देखा, जो पॉप्युलेट होती है वेक्टर डेटाबेस एम्बेडिंग के साथ, और तीन क्षेत्रों पर विचार किया गया जो खराब परिणाम दे सकते हैं: उप-इष्टतम एम्बेडिंग मॉडल, अकुशल चंकिंग रणनीतियाँ और मेटाडेटा फ़िल्टरिंग की कमी।

यहां, हम एलएलएम के साथ वास्तविक बातचीत को देखेंगे और कुछ सामान्य समस्याओं की जांच करेंगे जिनके कारण खराब परिणाम हो सकते हैं: अस्पष्ट संकेत और अपर्याप्त पीढ़ी दृष्टिकोण।

शीघ्र परिशोधन

यहां तक कि सर्वोत्तम एंबेडिंग और चंकिंग रणनीतियां भी गुणवत्ता की आवश्यकता को प्रतिस्थापित नहीं कर सकती हैं शीघ्र इंजीनियरिंग . इसमें संकेतों को अधिक स्पष्ट, विशिष्ट और इच्छित आउटपुट के साथ संरेखित करना शामिल है। आरएजी प्रक्रिया को बेहतर बनाने के लिए विभिन्न त्वरित प्रारूपों, लंबाई और शाब्दिक विकल्पों का परीक्षण किया जाना चाहिए।

एलएलएम पर एक सरलीकृत नज़र


विशेष रूप से, ऐसी कई चीजें हैं जिन पर आपको आरएजी अनुप्रयोगों के लिए अपने संकेत बनाते समय विचार करना चाहिए। इसमे शामिल है:


एलएलएम को इसकी भूमिका बताएं: चैटजीपीटी जैसे एलएलएम एजेंटों के साथ बातचीत करते समय, वे एक सहायक चैटबॉट की तरह कार्य करने में डिफ़ॉल्ट होंगे। हालाँकि, आप एलएलएम को एक विशेष तरीके से कार्य करने का निर्देश देकर उत्पन्न होने वाली प्रतिक्रियाओं की प्रकृति को बदल सकते हैं। उदाहरण कुछ इस तरह हो सकते हैं जैसे "आप एक वकील हैं जो मूल्यांकन कर रहे हैं कि क्या कोई पक्ष किसी समझौते का उल्लंघन कर रहा है" या "आप एक इंटरनेट सेवा प्रदाता के लिए ग्राहक सेवा एजेंट हैं;" आपका काम लोगों को उनकी इंटरनेट समस्याओं का निवारण करने में मदद करना है" या जो भी आपकी विशेष स्थिति के लिए समझ में आता हो।


एलएलएम को स्पष्ट रूप से दिए गए संदर्भ का उपयोग करने के लिए कहें : एलएलएम को यह स्पष्ट करें कि आप संदर्भ प्रदान कर रहे हैं, और आप चाहते हैं कि उत्पन्न प्रतिक्रिया उस संदर्भ को प्रतिबिंबित करे। आप ऐसा कुछ कहकर कर सकते हैं जैसे "आपकी प्रतिक्रिया को निम्नलिखित संदर्भ को ध्यान में रखना चाहिए" और उसके बाद संदर्भ। उदाहरणों का उपयोग करें: एलएलएम को अनुबंधों का मूल्यांकन करने वाले वकील के रूप में कार्य करने के लिए कहने के उपर्युक्त परिदृश्य में, आप प्रॉम्प्ट में कई उदाहरण शामिल करना चाह सकते हैं। उदाहरण के लिए, आप एक अनुबंध का उदाहरण प्रदान कर सकते हैं जो कहता है कि भुगतान 30 दिनों के भीतर देय है, लेकिन खरीदार ने अनुबंध पर हस्ताक्षर होने के 40 दिनों के बाद तक अपना भुगतान नहीं भेजा और इसलिए समझौते का उल्लंघन किया। आप उपचार के अधिकारों के अतिरिक्त उदाहरण और अनुबंध उल्लंघनों को हल करने के संभावित तरीके प्रदान कर सकते हैं।


आउटपुट प्रारूप निर्दिष्ट करें: यदि आपके उपयोग के मामले में विशिष्ट आउटपुट की आवश्यकता है, तो आप उस प्रारूप को निर्दिष्ट कर सकते हैं जिसका जेनरेट किए गए आउटपुट को पालन करना चाहिए। आप उदाहरण प्रदान करने के लिए इस तकनीक को उपरोक्त युक्ति के साथ जोड़ सकते हैं ताकि एलएलएम को यह स्पष्ट हो सके कि आप इसे कैसे प्रतिक्रिया देना चाहते हैं, साथ ही जानकारी के मुख्य बिंदु जो आप उत्पन्न प्रतिक्रिया में उम्मीद कर रहे हैं।


विचार श्रृंखला का उपयोग करें : उन मामलों के उपयोग के लिए जहां उचित प्रतिक्रिया निर्धारित करने के लिए तर्क शामिल है, आप उन चरणों को समझाने में सहायता के लिए विचार श्रृंखला नामक तकनीक का उपयोग करने पर विचार कर सकते हैं जिनका पालन आप चाहते हैं कि उत्पन्न प्रतिक्रिया पर पहुंचने के लिए एलएलएम का पालन किया जाए। उदाहरण के लिए, कानूनी अनुबंध मामले में, आप एलएलएम में उन तार्किक चरणों के माध्यम से चलना चाह सकते हैं जिनका पालन कोई व्यक्ति यह निर्धारित करने के लिए करेगा कि अनुबंध की शर्तों का उल्लंघन हुआ है या नहीं। उदाहरण के लिए, कानूनी अनुबंधों से निपटते समय आप एलएलएम को पहले उन खंडों को देखने के लिए कह सकते हैं जो भुगतान शर्तों को निर्दिष्ट करते हैं, फिर खरीदार को भुगतान जमा करने के समय की मात्रा की पहचान करें, फिर भुगतान प्राप्त होने के समय और उसके बाद के दिनों की संख्या की गणना करें। अनुबंध पर हस्ताक्षर किए जाने की तारीख. फिर, यदि भुगतान में सहमत समय सीमा से अधिक समय लगता है, तो खरीदार ने समझौते का उल्लंघन किया है।


अपनी त्वरित इंजीनियरिंग को बेहतर बनाने के लिए इन तकनीकों का लाभ उठाने से आपके आरएजी अनुप्रयोगों में उत्पन्न होने वाले उत्पन्न परिणामों की गुणवत्ता पर महत्वपूर्ण प्रभाव पड़ सकता है। हालाँकि, कभी-कभी आपको ऐसी तकनीकों का उपयोग करने की आवश्यकता होगी जिसमें स्वीकार्य प्रतिक्रिया प्राप्त करने के लिए एलएलएम के साथ कई आदान-प्रदान शामिल हों।

उन्नत पैटर्न

चमक

दूरंदेशी सक्रिय पुनर्प्राप्ति, या चमक , एक मल्टी-क्वेरी आरएजी तकनीक का एक उदाहरण है जिसमें आपके प्रॉम्प्ट में कस्टम निर्देशों के साथ एलएलएम को पुनरावृत्त रूप से कॉल करना शामिल है जो एलएलएम को प्रमुख वाक्यांशों के बारे में अतिरिक्त प्रश्न प्रदान करने के लिए कहता है जो बेहतर उत्तर उत्पन्न करने में मदद करेगा। एक बार जब एलएलएम में बिना किसी अंतराल के संदर्भ आ जाता है, तो यह अंतिम प्रतिक्रिया के साथ समाप्त हो जाता है। प्रक्रिया इन पुनरावृत्तियों को सुविधाजनक बनाने के लिए एलएलएम और एआई एजेंट (आरेख में एआई चैटबॉट) के बीच एक लूप जोड़ती है:

चमक


आप फ्लेयर के लैंगचेन कुकबुक उदाहरण में फ्लेयर कैसे काम करता है इसका एक उदाहरण देख सकते हैं।

आरएजी फ्यूजन

उपयोगकर्ता की क्वेरी के समान क्वेरी उत्पन्न करके और मूल क्वेरी के साथ-साथ जेनरेट की गई समान क्वेरी दोनों के लिए प्रासंगिक संदर्भ पुनर्प्राप्त करके, हम इस संभावना को बढ़ाने में सक्षम हैं कि हमने सटीक परिणाम उत्पन्न करने के लिए सबसे उपयोगी संदर्भ चुना है। प्रक्रिया, जिसे "आरएजी फ़्यूज़न" कहा जाता है, इस तरह दिखती है:

आरएजी फ्यूजन

यहां मुख्य कदम प्रतिक्रिया उत्पन्न करने के लिए सबसे प्रासंगिक संदर्भ की पहचान करने के लिए एएनएन परिणामों को और अधिक परिष्कृत करने के लिए पारस्परिक रैंक फ़ंक्शन का उपयोग करना है।

निष्कर्ष

आरएजी एक ऐसा दृष्टिकोण है जिसे आरंभ करना आसान है, लेकिन अक्सर डेवलपर्स अस्पष्ट कारणों से असंतोषजनक परिणामों से निराश हो जाते हैं। आरएजी-सक्षम जेनरेटिव एआई अनुप्रयोगों में आउटपुट की प्रासंगिकता कई कारकों से प्रभावित हो सकती है। एम्बेडिंग मॉडल का सावधानीपूर्वक चयन करके, चंकिंग रणनीतियों को तैयार करके और संकेतों को डिजाइन करके, आप चैटजीपीटी जैसे एलएलएम द्वारा संचालित सिस्टम में उत्पन्न प्रतिक्रियाओं की गुणवत्ता और सटीकता को महत्वपूर्ण रूप से बढ़ा सकते हैं। उम्मीद है कि ये युक्तियाँ आपको अधिक उपयोगी RAG एप्लिकेशन बनाने में मदद करेंगी जो आपके इच्छित अनुभव और मूल्य प्रदान करेंगी।


डेटास्टैक्स एस्ट्रा डीबी आज़माएं वास्तविक समय डेटा पर उत्पादन-स्तरीय एआई अनुप्रयोगों के निर्माण के लिए एकमात्र वेक्टर डेटाबेस।


क्रिस लैटिमर द्वारा, डेटास्टैक्स


यहाँ भी दिखाई देता है.