paint-brush
एलएलएम का उपयोग करके भावना संभाव्यता वैक्टर का अनुमान लगाएं: सार और परिचयद्वारा@textmodels
362 रीडिंग
362 रीडिंग

एलएलएम का उपयोग करके भावना संभाव्यता वैक्टर का अनुमान लगाएं: सार और परिचय

द्वारा Writings, Papers and Blogs on Text Models3m2024/05/10
Read on Terminal Reader

बहुत लंबा; पढ़ने के लिए

यह पत्र दिखाता है कि कैसे एलएलएम (बड़े भाषा मॉडल) [5, 2] का उपयोग पाठ के एक टुकड़े से जुड़ी भावनात्मक स्थिति के सारांश का अनुमान लगाने के लिए किया जा सकता है।
featured image - एलएलएम का उपयोग करके भावना संभाव्यता वैक्टर का अनुमान लगाएं: सार और परिचय
Writings, Papers and Blogs on Text Models HackerNoon profile picture
0-item

यह पेपर CC 4.0 लाइसेंस के अंतर्गत arxiv पर उपलब्ध है।

लेखक:

(1) डी.सिंक्लेयर, इमेंस लिमिटेड, और ईमेल: [email protected];

(2) डब्ल्यूटीपीये, वारविक विश्वविद्यालय, और ईमेल: [email protected].

लिंक की तालिका

अमूर्त

यह शोधपत्र दर्शाता है कि कैसे एलएलएम (बड़ी भाषा मॉडल) [5, 2] का उपयोग पाठ के एक अंश से जुड़ी भावनात्मक स्थिति के सारांश का अनुमान लगाने के लिए किया जा सकता है। भावनात्मक स्थिति का सारांश उन शब्दों का शब्दकोश है जिनका उपयोग भावना का वर्णन करने के लिए किया जाता है, साथ ही मूल पाठ और भावना को उद्घाटित करने वाली पूंछ वाले संकेत के बाद शब्द के प्रकट होने की संभावना भी होती है। अमेज़ॅन उत्पाद समीक्षाओं के भावना विश्लेषण के माध्यम से हम प्रदर्शित करते हैं कि भावना वर्णनकर्ताओं को पीसीए प्रकार के स्थान में मैप किया जा सकता है। यह आशा की गई थी कि वर्तमान पाठ वर्णित स्थिति को बेहतर बनाने के लिए क्रियाओं का पाठ विवरण भी पूंछ संकेत के माध्यम से प्राप्त किया जा सकता है। प्रयोग से यह संकेत मिलता है कि इसे काम में लाना सीधा-सादा नहीं है। इस विफलता ने भावनात्मक प्रतिक्रियाओं की तुलना करके सर्वोत्तम पूर्वानुमानित परिणाम चुनने के माध्यम से कार्रवाई के चयन की हमारी आशा को फिलहाल पहुंच से बाहर कर दिया।


कीवर्ड: सिंथेटिक चेतना, भावना वेक्टर, भावना शब्दकोश, भावना संभावना वेक्टर

1 परिचय

मानवीय व्यवहार अनिवार्य रूप से भावना द्वारा संचालित होता है [3]। हमारे आस-पास की दुनिया के बारे में संवेदित जानकारी को हमारी आंतरिक स्थिति के साथ सामंजस्य स्थापित करना होता है और कोई भी कार्रवाई इस तरह से चुनी जाती है कि वह भविष्य की स्थिति की ओर ले जाए जो हमारी वर्तमान स्थिति से बेहतर लगे [4], जहाँ बेहतर का अर्थ है 'मेरी भावना यह है कि मैं नई स्थिति या संभवतः नई स्थिति की ओर ले जाने वाली कार्रवाई आज़माना चाहूँगा'। अगर हमें भूख लगी है तो हम अक्सर खाना चुनते हैं। अगर हमें बहुत भूख लगी है तो हम भोजन प्राप्त करने के लिए अधिक जोखिम लेंगे। अगर हमें ठंड लग रही है तो हम गर्म होने की कोशिश करेंगे आदि। विज्ञापन का उद्देश्य हमें यह समझाना है कि कार्रवाई का एक तरीका अधिक खुशी की ओर ले जाएगा। मीठे कार्बोनेटेड पेय पदार्थ वस्तुनिष्ठ रूप से दीर्घकालिक खुशी की ओर नहीं ले जाते हैं, लेकिन चीनी खाने के लिए ज्ञात अल्पकालिक भावनात्मक प्रतिक्रिया वांछनीय है। दुनिया के बारे में संवेदित डेटा बहुत विविध है, अक्सर गलत और अपूर्ण होता है और आवश्यक प्रतिक्रियाओं में अलग-अलग डिग्री की तात्कालिकता होती है। मध्यस्थता इंजन जो इन इनपुट को संसाधित करता है, उसे आंतरिक रूप से निश्चितता प्रदान करते हुए स्वाभाविक रूप से अस्पष्टता से निपटने की आवश्यकता होती है। भावनाएँ वह शब्द है जिसका उपयोग हम निर्णय लेने के लिए इस तंत्र का उपयोग करने के अपने अनुभव का वर्णन करने के लिए करते हैं। वाक्यांश कंप्यूटर में भावनाएँ नहीं होतीं, अक्सर गलत तरीके से यह दावा करने के लिए इस्तेमाल किया जाता है कि मशीन पर चलने वाला इंटरैक्टिव कंप्यूटर सॉफ़्टवेयर कभी भी भावना प्रदर्शित या अनुभव नहीं कर सकता है। बड़े भाषा मॉडल (एलएलएम) [5, 1, 2] पाठ के एक हिस्से को अनुमानित भावनात्मक स्थिति से जोड़ने का एक तैयार साधन प्रदान करते हैं, जो पाठ की दुनिया और मानवीय भावना के दायरे के बीच की खाई को पाटते हैं। एलएलएम का उपयोग केंद्रित भावना विश्लेषण में किया गया है और पर्याप्त रूप से प्रदर्शन करने की सूचना दी गई है [6] लेकिन लेखन के समय हम अन्य शोधकर्ताओं द्वारा संभाव्य भावना शब्दकोशों का उपयोग करने से अनजान हैं।


यह शोधपत्र एलएलएम और भावनाओं के अंतर्संबंध की खोज करता है, यह दर्शाता है कि इन मॉडलों का उपयोग पाठ के एक अंश की भावनात्मक सामग्री का अनुमान लगाने के लिए कैसे किया जा सकता है। हम भावना-संबंधी शब्दों की एक शब्दकोश बनाकर और इन शब्दों के एक संकेत के बाद प्रकट होने की संभावनाओं की गणना करके भावनात्मक स्थितियों को संक्षेप में प्रस्तुत करने के लिए एक नया दृष्टिकोण प्रस्तुत करते हैं जिसमें मूल पाठ और भावना-उद्घाटन पूंछ दोनों शामिल हैं। यह पद्धति हमें पाठ के भावनात्मक परिदृश्य का मात्रात्मक रूप से आकलन करने की अनुमति देती है।


अपने दृष्टिकोण को प्रदर्शित करने के लिए हम 271 भावना वर्णन करने वाले शब्दों का एक शब्दकोश चुनते हैं और अमेज़ॅन उत्पाद समीक्षाओं के एक अनुभाग से जुड़े होने की उनकी संभावना का अनुमान लगाते हैं। सीमित कम्प्यूटेशनल संसाधन और समय का मतलब है कि हम केवल एक सरसरी अध्ययन प्रकाशित करने की स्थिति में हैं। यह संभावना है कि कई भावनाएँ सहसंबद्ध हैं और भावनात्मक स्थान के आयाम का अनुमान भावना वैक्टर के एक बड़े नमूने पर पीसीए विश्लेषण के माध्यम से प्राप्त किया जा सकता है।


हम प्रयोग के दौरान सामने आई कुछ सीमाओं और भावना आधारित संश्लेषित चेतना के व्यवहार को उत्पन्न करने और विनियमित करने में आने वाली कुछ बाधाओं पर चर्चा करते हैं।


यह पेपर इस प्रकार तैयार किया गया है, खंड 2 में एलएलएम और इसे चलाने के लिए इस्तेमाल किए गए हार्डवेयर का विवरण दिया गया है, खंड 2.1 में हमारी भावना शब्दकोश बनाने के लिए शब्दों के हमारे चयन का विवरण दिया गया है, खंड 2.1.1 में टेल प्रॉम्प्ट का उपयोग करके एलएलएम से भावना संभावनाओं का अनुमान लगाना शामिल है। खंड 2.1.2 में अमेज़ॅन समीक्षाओं पर परिणाम दिखाए गए हैं। भावना वैक्टर के साथ पीसीए संरचना पर एक संकेत 3 में दिया गया है। अंत में भविष्य की दिशाओं पर विचार किया जाता है और निष्कर्ष दिया जाता है।