लेखक:
(1) ज़ियाओफ़ेई सन, झेजियांग विश्वविद्यालय;
(2) ज़ियाओया ली, शैनन.एआई और बाइटडांस;
(3) शेंगयु झांग, झेजियांग विश्वविद्यालय;
(4) शुहे वांग, पेकिंग विश्वविद्यालय;
(5) फेई वू, झेजियांग विश्वविद्यालय;
(6) जिवेई ली, झेजियांग विश्वविद्यालय;
(7) तियानवेई झांग, नानयांग टेक्नोलॉजिकल यूनिवर्सिटी;
(8) गुओयिन वांग, शैनन.एआई और बाइटडांस।
भावना विश्लेषण के लिए एलएलएम वार्ता
इस खंड में, हम भावना विश्लेषण के लिए बहु-एलएलएम वार्ता ढांचे का विस्तार से वर्णन करते हैं: दो एलएलएम उत्तर जनरेटर और विभेदक के रूप में कार्य करते हैं। हम जनरेटर और विभेदक के बीच की बातचीत को वार्ता कहते हैं। वार्ता तब तक दोहराई जाएगी जब तक कि आम सहमति नहीं बन जाती या वार्ता के अधिकतम मोड़ पार नहीं हो जाते। चित्र 1 और 2 में चित्रण दिखाए गए हैं।
जनरेटर एक बड़े भाषा मॉडल द्वारा समर्थित है। हम संकेतों के माध्यम से ICL प्रतिमान के आधार पर उत्तर जनरेटर से पूछते हैं, जिसका उद्देश्य चरण-दर-चरण तर्क श्रृंखला और परीक्षण इनपुट की भावना ध्रुवता के प्रति निर्णय उत्पन्न करना है।
प्रॉम्प्ट तीन तत्वों से बने होते हैं: कार्य विवरण, प्रदर्शन और परीक्षण इनपुट। कार्य विवरण प्राकृतिक भाषा में कार्य का विवरण होता है (उदाहरण के लिए, "कृपया परीक्षण इनपुट की समग्र भावना निर्धारित करें।"); परीक्षण इनपुट परीक्षण सेट में पाठ्य इनपुट होता है (उदाहरण के लिए, "आकाश नीला है।"); प्रदर्शन कार्य के ट्रेन सेट से होते हैं। प्रत्येक में तीन तत्व होते हैं: इनपुट, तर्क श्रृंखला और भावनात्मक निर्णय।
प्रत्येक परीक्षण इनपुट के लिए, हम सबसे पहले ट्रेन सेट से K निकटतम पड़ोसियों (इनपुट, भावना निर्णय) को प्रदर्शन के रूप में प्राप्त करते हैं। फिर, हम जनरेटर को तर्क श्रृंखला बनाने के लिए संकेत देकर प्रदर्शनों को (इनपुट, तर्क प्रक्रिया, भावना निर्णय) ट्रिपल में बदल देते हैं। कार्य विवरण, प्रदर्शन और परीक्षण इनपुट को संयोजित करने के बाद, हम जनरेटर को संकेत भेजते हैं, जो एक चरण-दर-चरण तर्क श्रृंखला और एक भावनात्मक निर्णय के साथ प्रतिक्रिया देगा।
विभेदक को दूसरे LLM द्वारा बैकबोन किया जाता है। उत्तर बनाने की प्रक्रिया समाप्त होने के बाद, उत्तर विभेदक का उपयोग यह तय करने के लिए किया जाता है कि जनरेटर द्वारा लिया गया निर्णय सही है या नहीं और एक उचित स्पष्टीकरण प्रदान करता है।
इस लक्ष्य को पूरा करने के लिए, हम सबसे पहले उत्तर विभेदक के लिए संकेत बनाते हैं। संकेत चार तत्वों से बना होता है: कार्य विवरण, प्रदर्शन, परीक्षण इनपुट और उत्तर जनरेटर से प्रतिक्रिया। कार्य विवरण पाठ का एक टुकड़ा होता है जो प्राकृतिक भाषा में कार्य का वर्णन करता है (उदाहरण के लिए, "कृपया निर्धारित करें कि निर्णय सही है या नहीं।")। प्रत्येक प्रदर्शन छह तत्वों से बना होता है: (इनपुट पाठ, एक तर्क श्रृंखला, भावना निर्णय, विभेदक रवैया, विभेदक स्पष्टीकरण, विभेदक निर्णय) और उत्तर विभेदक को इनपुट पाठ के लिए भावना निर्णय सही क्यों है, इसका स्पष्टीकरण देने के लिए प्रेरित करके बनाया गया है।
फिर हम निर्माण संकेत के साथ विभेदक से पूछते हैं। उत्तर विभेदक एक टेक्स्ट स्ट्रिंग के साथ जवाब देगा, जिसमें एक दृष्टिकोण (यानी, हाँ, नहीं) शामिल होगा जो दर्शाता है कि विभेदक जनरेटर से सहमत है या नहीं, स्पष्टीकरण जो बताते हैं कि विभेदक जनरेटर से सहमत/असहमत क्यों है, और एक विभेदक निर्णय जो परीक्षण इनपुट की भावना को निर्धारित करता है।
दो एलएलएम क्यों, एक क्यों नहीं? जनरेटर और विभेदक के लिए अलग-अलग दो अलग-अलग एलएलएम का उपयोग करने के दो कारण हैं, बजाय एक ही एलएलएम का उपयोग दो भूमिकाओं के रूप में करने के: (1) यदि एक एलएलएम गलत तर्क के कारण जनरेटर के रूप में गलती करता है, तो यह अधिक संभावना है कि यह विभेदक के समान ही गलती करेगा क्योंकि एक ही मॉडल से जनरेटर और विभेदक के समान तर्क देने की बहुत संभावना है; (2) दो अलग-अलग मॉडलों का उपयोग करके, हम दो मॉडलों की पूरक क्षमताओं का लाभ उठाने में सक्षम हैं।
दो एलएलएम के बातचीत के साथ समाप्त होने के बाद, हम उनसे भूमिकाएँ बदलने और एक नई बातचीत शुरू करने के लिए कहते हैं, जहाँ दूसरा एलएलएम जनरेटर के रूप में कार्य करता है, और पहला एलएलएम विभेदक के रूप में कार्य करता है। हम दो एलएलएम के बीच फ़्लिप की गई भूमिकाओं के साथ बातचीत को रोल-फ़्लिप्ड बातचीत के रूप में संदर्भित करते हैं। इसी तरह, रोल-फ़्लिप्ड बातचीत तब तक समाप्त होती है जब तक कि आम सहमति नहीं बन जाती या बातचीत के अधिकतम मोड़ पार नहीं हो जाते।
जब दोनों वार्ताओं के परिणामस्वरूप सहमति बनती है और उनके निर्णय एक जैसे होते हैं, तो हम किसी भी निर्णय को अंतिम के रूप में चुन सकते हैं क्योंकि वे एक जैसे होते हैं। यदि वार्ताओं में से एक आम सहमति तक पहुँचने में विफल रहती है जबकि दूसरी किसी निर्णय पर पहुँचती है, तो हम उस वार्ता से निर्णय को अंतिम निर्णय के रूप में चुनते हैं जो आम सहमति पर पहुँचती है। हालाँकि, यदि दोनों वार्ताएँ आम सहमति पर पहुँचती हैं लेकिन उनके निर्णय मेल नहीं खाते हैं, तो हमें एक अतिरिक्त भाषा मॉडल (LLM) की सहायता की आवश्यकता होगी, जैसा कि नीचे अधिक विस्तार से समझाया जाएगा।"
तीसरे एलएलएम का परिचय यदि दो वार्ताओं से निर्णय संरेखित नहीं होते हैं, तो हम तीसरे एलएलएम का परिचय देते हैं और दो उपर्युक्त एलएलएम में से प्रत्येक के साथ वार्ता और भूमिका-फ़्लिप वार्ता का संचालन करते हैं। इसके बाद, हमें 6 वार्ता परिणाम मिलेंगे और इन परिणामों पर वोट करेंगे: जो निर्णय सबसे अधिक बार दिखाई देता है उसे इनपुट परीक्षण की भावना ध्रुवता के रूप में लिया जाता है।
यह पेपर CC 4.0 लाइसेंस के अंतर्गत arxiv पर उपलब्ध है।