paint-brush
बेहतर भावना विश्लेषण निर्णयों के लिए दो एलएलएम का लाभ उठानाद्वारा@textmodels
255 रीडिंग

बेहतर भावना विश्लेषण निर्णयों के लिए दो एलएलएम का लाभ उठाना

द्वारा Writings, Papers and Blogs on Text Models4m2024/05/20
Read on Terminal Reader

बहुत लंबा; पढ़ने के लिए

भावना विश्लेषण के लिए एक बहु-एलएलएम वार्ता ढांचे में दो एलएलएम शामिल हैं, एक जनरेटर के रूप में और दूसरा भेदभावकर्ता के रूप में, सटीक भावना निर्णयों के लिए भूमिका-फ्लिप वार्ता में संलग्न है। यदि आवश्यक हो, तो परस्पर विरोधी निर्णयों को हल करने के लिए एक तीसरा एलएलएम पेश किया जाता है। यह दृष्टिकोण भावना विश्लेषण एल्गोरिदम को अनुकूलित करता है और भावना विश्लेषण कार्यों में एआई क्षमताओं को बढ़ाता है।
featured image - बेहतर भावना विश्लेषण निर्णयों के लिए दो एलएलएम का लाभ उठाना
Writings, Papers and Blogs on Text Models HackerNoon profile picture
0-item

लेखक:

(1) ज़ियाओफ़ेई सन, झेजियांग विश्वविद्यालय;

(2) ज़ियाओया ली, शैनन.एआई और बाइटडांस;

(3) शेंगयु झांग, झेजियांग विश्वविद्यालय;

(4) शुहे वांग, पेकिंग विश्वविद्यालय;

(5) फेई वू, झेजियांग विश्वविद्यालय;

(6) जिवेई ली, झेजियांग विश्वविद्यालय;

(7) तियानवेई झांग, नानयांग टेक्नोलॉजिकल यूनिवर्सिटी;

(8) गुओयिन वांग, शैनन.एआई और बाइटडांस।

लिंक की तालिका

सार और परिचय

संबंधित कार्य

भावना विश्लेषण के लिए एलएलएम वार्ता

प्रयोगों

पृथक्करण अध्ययन

निष्कर्ष और संदर्भ

3 एलएलएम भावना विश्लेषण के लिए बातचीत

3.1 अवलोकन

इस खंड में, हम भावना विश्लेषण के लिए बहु-एलएलएम वार्ता ढांचे का विस्तार से वर्णन करते हैं: दो एलएलएम उत्तर जनरेटर और विभेदक के रूप में कार्य करते हैं। हम जनरेटर और विभेदक के बीच की बातचीत को वार्ता कहते हैं। वार्ता तब तक दोहराई जाएगी जब तक कि आम सहमति नहीं बन जाती या वार्ता के अधिकतम मोड़ पार नहीं हो जाते। चित्र 1 और 2 में चित्रण दिखाए गए हैं।

3.2 तर्क-प्रधान जनरेटर

जनरेटर एक बड़े भाषा मॉडल द्वारा समर्थित है। हम संकेतों के माध्यम से ICL प्रतिमान के आधार पर उत्तर जनरेटर से पूछते हैं, जिसका उद्देश्य चरण-दर-चरण तर्क श्रृंखला और परीक्षण इनपुट की भावना ध्रुवता के प्रति निर्णय उत्पन्न करना है।


प्रॉम्प्ट तीन तत्वों से बने होते हैं: कार्य विवरण, प्रदर्शन और परीक्षण इनपुट। कार्य विवरण प्राकृतिक भाषा में कार्य का विवरण होता है (उदाहरण के लिए, "कृपया परीक्षण इनपुट की समग्र भावना निर्धारित करें।"); परीक्षण इनपुट परीक्षण सेट में पाठ्य इनपुट होता है (उदाहरण के लिए, "आकाश नीला है।"); प्रदर्शन कार्य के ट्रेन सेट से होते हैं। प्रत्येक में तीन तत्व होते हैं: इनपुट, तर्क श्रृंखला और भावनात्मक निर्णय।


प्रत्येक परीक्षण इनपुट के लिए, हम सबसे पहले ट्रेन सेट से K निकटतम पड़ोसियों (इनपुट, भावना निर्णय) को प्रदर्शन के रूप में प्राप्त करते हैं। फिर, हम जनरेटर को तर्क श्रृंखला बनाने के लिए संकेत देकर प्रदर्शनों को (इनपुट, तर्क प्रक्रिया, भावना निर्णय) ट्रिपल में बदल देते हैं। कार्य विवरण, प्रदर्शन और परीक्षण इनपुट को संयोजित करने के बाद, हम जनरेटर को संकेत भेजते हैं, जो एक चरण-दर-चरण तर्क श्रृंखला और एक भावनात्मक निर्णय के साथ प्रतिक्रिया देगा।

3.3 स्पष्टीकरण-व्युत्पन्न विभेदक

विभेदक को दूसरे LLM द्वारा बैकबोन किया जाता है। उत्तर बनाने की प्रक्रिया समाप्त होने के बाद, उत्तर विभेदक का उपयोग यह तय करने के लिए किया जाता है कि जनरेटर द्वारा लिया गया निर्णय सही है या नहीं और एक उचित स्पष्टीकरण प्रदान करता है।


इस लक्ष्य को पूरा करने के लिए, हम सबसे पहले उत्तर विभेदक के लिए संकेत बनाते हैं। संकेत चार तत्वों से बना होता है: कार्य विवरण, प्रदर्शन, परीक्षण इनपुट और उत्तर जनरेटर से प्रतिक्रिया। कार्य विवरण पाठ का एक टुकड़ा होता है जो प्राकृतिक भाषा में कार्य का वर्णन करता है (उदाहरण के लिए, "कृपया निर्धारित करें कि निर्णय सही है या नहीं।")। प्रत्येक प्रदर्शन छह तत्वों से बना होता है: (इनपुट पाठ, एक तर्क श्रृंखला, भावना निर्णय, विभेदक रवैया, विभेदक स्पष्टीकरण, विभेदक निर्णय) और उत्तर विभेदक को इनपुट पाठ के लिए भावना निर्णय सही क्यों है, इसका स्पष्टीकरण देने के लिए प्रेरित करके बनाया गया है।


फिर हम निर्माण संकेत के साथ विभेदक से पूछते हैं। उत्तर विभेदक एक टेक्स्ट स्ट्रिंग के साथ जवाब देगा, जिसमें एक दृष्टिकोण (यानी, हाँ, नहीं) शामिल होगा जो दर्शाता है कि विभेदक जनरेटर से सहमत है या नहीं, स्पष्टीकरण जो बताते हैं कि विभेदक जनरेटर से सहमत/असहमत क्यों है, और एक विभेदक निर्णय जो परीक्षण इनपुट की भावना को निर्धारित करता है।


दो एलएलएम क्यों, एक क्यों नहीं? जनरेटर और विभेदक के लिए अलग-अलग दो अलग-अलग एलएलएम का उपयोग करने के दो कारण हैं, बजाय एक ही एलएलएम का उपयोग दो भूमिकाओं के रूप में करने के: (1) यदि एक एलएलएम गलत तर्क के कारण जनरेटर के रूप में गलती करता है, तो यह अधिक संभावना है कि यह विभेदक के समान ही गलती करेगा क्योंकि एक ही मॉडल से जनरेटर और विभेदक के समान तर्क देने की बहुत संभावना है; (2) दो अलग-अलग मॉडलों का उपयोग करके, हम दो मॉडलों की पूरक क्षमताओं का लाभ उठाने में सक्षम हैं।

3.4 भूमिका-परिवर्तन वार्ता

दो एलएलएम के बातचीत के साथ समाप्त होने के बाद, हम उनसे भूमिकाएँ बदलने और एक नई बातचीत शुरू करने के लिए कहते हैं, जहाँ दूसरा एलएलएम जनरेटर के रूप में कार्य करता है, और पहला एलएलएम विभेदक के रूप में कार्य करता है। हम दो एलएलएम के बीच फ़्लिप की गई भूमिकाओं के साथ बातचीत को रोल-फ़्लिप्ड बातचीत के रूप में संदर्भित करते हैं। इसी तरह, रोल-फ़्लिप्ड बातचीत तब तक समाप्त होती है जब तक कि आम सहमति नहीं बन जाती या बातचीत के अधिकतम मोड़ पार नहीं हो जाते।


जब दोनों वार्ताओं के परिणामस्वरूप सहमति बनती है और उनके निर्णय एक जैसे होते हैं, तो हम किसी भी निर्णय को अंतिम के रूप में चुन सकते हैं क्योंकि वे एक जैसे होते हैं। यदि वार्ताओं में से एक आम सहमति तक पहुँचने में विफल रहती है जबकि दूसरी किसी निर्णय पर पहुँचती है, तो हम उस वार्ता से निर्णय को अंतिम निर्णय के रूप में चुनते हैं जो आम सहमति पर पहुँचती है। हालाँकि, यदि दोनों वार्ताएँ आम सहमति पर पहुँचती हैं लेकिन उनके निर्णय मेल नहीं खाते हैं, तो हमें एक अतिरिक्त भाषा मॉडल (LLM) की सहायता की आवश्यकता होगी, जैसा कि नीचे अधिक विस्तार से समझाया जाएगा।"


तीसरे एलएलएम का परिचय यदि दो वार्ताओं से निर्णय संरेखित नहीं होते हैं, तो हम तीसरे एलएलएम का परिचय देते हैं और दो उपर्युक्त एलएलएम में से प्रत्येक के साथ वार्ता और भूमिका-फ़्लिप वार्ता का संचालन करते हैं। इसके बाद, हमें 6 वार्ता परिणाम मिलेंगे और इन परिणामों पर वोट करेंगे: जो निर्णय सबसे अधिक बार दिखाई देता है उसे इनपुट परीक्षण की भावना ध्रुवता के रूप में लिया जाता है।


यह पेपर CC 4.0 लाइसेंस के अंतर्गत arxiv पर उपलब्ध है।