यह पेपर CC 4.0 लाइसेंस के अंतर्गत arxiv पर उपलब्ध है।
लेखक:
(1) डी.सिंक्लेयर, इमेंस लिमिटेड, और ईमेल: [email protected];
(2) डब्ल्यूटीपीये, वारविक विश्वविद्यालय, और ईमेल: [email protected].
यह शोधपत्र दर्शाता है कि कैसे एलएलएम (बड़ी भाषा मॉडल) [5, 2] का उपयोग पाठ के एक अंश से जुड़ी भावनात्मक स्थिति के सारांश का अनुमान लगाने के लिए किया जा सकता है। भावनात्मक स्थिति का सारांश उन शब्दों का शब्दकोश है जिनका उपयोग भावना का वर्णन करने के लिए किया जाता है, साथ ही मूल पाठ और भावना को उद्घाटित करने वाली पूंछ वाले संकेत के बाद शब्द के प्रकट होने की संभावना भी होती है। अमेज़ॅन उत्पाद समीक्षाओं के भावना विश्लेषण के माध्यम से हम प्रदर्शित करते हैं कि भावना वर्णनकर्ताओं को पीसीए प्रकार के स्थान में मैप किया जा सकता है। यह आशा की गई थी कि वर्तमान पाठ वर्णित स्थिति को बेहतर बनाने के लिए क्रियाओं का पाठ विवरण भी पूंछ संकेत के माध्यम से प्राप्त किया जा सकता है। प्रयोग से यह संकेत मिलता है कि इसे काम में लाना सीधा-सादा नहीं है। इस विफलता ने भावनात्मक प्रतिक्रियाओं की तुलना करके सर्वोत्तम पूर्वानुमानित परिणाम चुनने के माध्यम से कार्रवाई के चयन की हमारी आशा को फिलहाल पहुंच से बाहर कर दिया।
कीवर्ड: सिंथेटिक चेतना, भावना वेक्टर, भावना शब्दकोश, भावना संभावना वेक्टर
मानवीय व्यवहार अनिवार्य रूप से भावना द्वारा संचालित होता है [3]। हमारे आस-पास की दुनिया के बारे में संवेदित जानकारी को हमारी आंतरिक स्थिति के साथ सामंजस्य स्थापित करना होता है और कोई भी कार्रवाई इस तरह से चुनी जाती है कि वह भविष्य की स्थिति की ओर ले जाए जो हमारी वर्तमान स्थिति से बेहतर लगे [4], जहाँ बेहतर का अर्थ है 'मेरी भावना यह है कि मैं नई स्थिति या संभवतः नई स्थिति की ओर ले जाने वाली कार्रवाई आज़माना चाहूँगा'। अगर हमें भूख लगी है तो हम अक्सर खाना चुनते हैं। अगर हमें बहुत भूख लगी है तो हम भोजन प्राप्त करने के लिए अधिक जोखिम लेंगे। अगर हमें ठंड लग रही है तो हम गर्म होने की कोशिश करेंगे आदि। विज्ञापन का उद्देश्य हमें यह समझाना है कि कार्रवाई का एक तरीका अधिक खुशी की ओर ले जाएगा। मीठे कार्बोनेटेड पेय पदार्थ वस्तुनिष्ठ रूप से दीर्घकालिक खुशी की ओर नहीं ले जाते हैं, लेकिन चीनी खाने के लिए ज्ञात अल्पकालिक भावनात्मक प्रतिक्रिया वांछनीय है। दुनिया के बारे में संवेदित डेटा बहुत विविध है, अक्सर गलत और अपूर्ण होता है और आवश्यक प्रतिक्रियाओं में अलग-अलग डिग्री की तात्कालिकता होती है। मध्यस्थता इंजन जो इन इनपुट को संसाधित करता है, उसे आंतरिक रूप से निश्चितता प्रदान करते हुए स्वाभाविक रूप से अस्पष्टता से निपटने की आवश्यकता होती है। भावनाएँ वह शब्द है जिसका उपयोग हम निर्णय लेने के लिए इस तंत्र का उपयोग करने के अपने अनुभव का वर्णन करने के लिए करते हैं। वाक्यांश कंप्यूटर में भावनाएँ नहीं होतीं, अक्सर गलत तरीके से यह दावा करने के लिए इस्तेमाल किया जाता है कि मशीन पर चलने वाला इंटरैक्टिव कंप्यूटर सॉफ़्टवेयर कभी भी भावना प्रदर्शित या अनुभव नहीं कर सकता है। बड़े भाषा मॉडल (एलएलएम) [5, 1, 2] पाठ के एक हिस्से को अनुमानित भावनात्मक स्थिति से जोड़ने का एक तैयार साधन प्रदान करते हैं, जो पाठ की दुनिया और मानवीय भावना के दायरे के बीच की खाई को पाटते हैं। एलएलएम का उपयोग केंद्रित भावना विश्लेषण में किया गया है और पर्याप्त रूप से प्रदर्शन करने की सूचना दी गई है [6] लेकिन लेखन के समय हम अन्य शोधकर्ताओं द्वारा संभाव्य भावना शब्दकोशों का उपयोग करने से अनजान हैं।
यह शोधपत्र एलएलएम और भावनाओं के अंतर्संबंध की खोज करता है, यह दर्शाता है कि इन मॉडलों का उपयोग पाठ के एक अंश की भावनात्मक सामग्री का अनुमान लगाने के लिए कैसे किया जा सकता है। हम भावना-संबंधी शब्दों की एक शब्दकोश बनाकर और इन शब्दों के एक संकेत के बाद प्रकट होने की संभावनाओं की गणना करके भावनात्मक स्थितियों को संक्षेप में प्रस्तुत करने के लिए एक नया दृष्टिकोण प्रस्तुत करते हैं जिसमें मूल पाठ और भावना-उद्घाटन पूंछ दोनों शामिल हैं। यह पद्धति हमें पाठ के भावनात्मक परिदृश्य का मात्रात्मक रूप से आकलन करने की अनुमति देती है।
अपने दृष्टिकोण को प्रदर्शित करने के लिए हम 271 भावना वर्णन करने वाले शब्दों का एक शब्दकोश चुनते हैं और अमेज़ॅन उत्पाद समीक्षाओं के एक अनुभाग से जुड़े होने की उनकी संभावना का अनुमान लगाते हैं। सीमित कम्प्यूटेशनल संसाधन और समय का मतलब है कि हम केवल एक सरसरी अध्ययन प्रकाशित करने की स्थिति में हैं। यह संभावना है कि कई भावनाएँ सहसंबद्ध हैं और भावनात्मक स्थान के आयाम का अनुमान भावना वैक्टर के एक बड़े नमूने पर पीसीए विश्लेषण के माध्यम से प्राप्त किया जा सकता है।
हम प्रयोग के दौरान सामने आई कुछ सीमाओं और भावना आधारित संश्लेषित चेतना के व्यवहार को उत्पन्न करने और विनियमित करने में आने वाली कुछ बाधाओं पर चर्चा करते हैं।
यह पेपर इस प्रकार तैयार किया गया है, खंड 2 में एलएलएम और इसे चलाने के लिए इस्तेमाल किए गए हार्डवेयर का विवरण दिया गया है, खंड 2.1 में हमारी भावना शब्दकोश बनाने के लिए शब्दों के हमारे चयन का विवरण दिया गया है, खंड 2.1.1 में टेल प्रॉम्प्ट का उपयोग करके एलएलएम से भावना संभावनाओं का अनुमान लगाना शामिल है। खंड 2.1.2 में अमेज़ॅन समीक्षाओं पर परिणाम दिखाए गए हैं। भावना वैक्टर के साथ पीसीए संरचना पर एक संकेत 3 में दिया गया है। अंत में भविष्य की दिशाओं पर विचार किया जाता है और निष्कर्ष दिया जाता है।