paint-brush
估计情绪概率向量:用引发情绪的尾部提示询问法学硕士经过@textmodels
457 讀數
457 讀數

估计情绪概率向量:用引发情绪的尾部提示询问法学硕士

太長; 讀書

本文展示了如何使用 LLM (大型语言模型) [5, 2] 来估计与一段文本相关的情绪状态摘要。
featured image - 估计情绪概率向量:用引发情绪的尾部提示询问法学硕士
Writings, Papers and Blogs on Text Models HackerNoon profile picture
0-item

该论文可在 arxiv 上根据 CC 4.0 许可获取。

作者:

(1)D.Sinclair,Imense Ltd,电子邮箱:[email protected]

(2)华威大学WTPye,电子邮箱:[email protected]

链接表

2. 用引发情绪的尾部提示来询问法学硕士

在这项工作中,我们使用了 Facebook 的开源 LlaMa2 70 亿权重 LLM 作为核心引擎 [2]。有必要使用允许在提示后访问原始标记概率的 LLM。该模型在具有 32 GB RAM 的 Mac Studio 上运行。使用这种硬件和模型组合,需要 2 分钟才能计算出下面给出的情绪词典中情绪描述符的概率。

2.1. 情绪词典

英语中词汇丰富,文献丰富,提供了在适当语境中使用这些词汇的例子。对于法学硕士来说,单词的语境可以传达其含义。读者会通过他们发现单词所处的语境推断出不熟悉单词的含义,前提是他们理解该语境。例如,“猎枪把兔子弄得神志不清。”显示了语境如何调节含义。尾部提示创建的语境将有利于相关的词类。对于本文详述的实验,以下尾部提示用于引出情绪描述符,“阅读这个让我有感觉”。特定的情绪引出尾部提示可能会有利于特定的描述符子类,但研究这一点超出了本文的范围


选择以下词语来提供广泛的情感描述样本。


接受、钦佩、崇拜、感情、害怕、激动、痛苦、攻击性、警报、惊慌、疏远、惊奇、矛盾、娱乐、愤怒、痛苦、恼火、期待、焦虑、冷漠、忧虑、傲慢、自信、惊讶、专注、吸引、厌恶、敬畏、困惑、迷茫、苦涩、苦乐参半、幸福、无聊、厚颜无耻、沉思、平静、无忧无虑、粗心、关怀、慈善、厚脸皮、快乐、幽闭恐惧症、强制性、舒适、自信、困惑、蔑视、满足、勇气、懦弱、残忍、好奇心、玩世不恭、茫然、沮丧、高兴、士气低落、沮丧、欲望、绝望、决心、失望、怀疑、心烦意乱、不适、不满、不满、厌恶、灰心、不喜欢、沮丧、迷失方向,沮丧、不快、分心、苦恼、不安、占主导地位、怀疑、恐惧、驱使、目瞪口呆、渴望、狂喜、兴高采烈、尴尬、同情、陶醉、享受、开明、厌倦、热情、嫉妒、顿悟、欣快、恼怒、兴奋、期望、迷恋、恐惧、古怪、专注、喜爱、友好、惊吓、沮丧、暴怒、欢乐、阴郁、忧郁、感激、贪婪、悲伤、脾气暴躁、脾气暴躁、内疚、幸福、仇恨、仇恨、无助、思乡、希望、绝望、惊恐、好客、羞辱、谦卑、伤害、歇斯底里、懒惰、不耐烦、冷漠、愤慨、迷恋、愤怒、不安全感、有洞察力、侮辱、兴趣、好奇、恼怒、孤立、嫉妒、快活、喜悦、欢腾、善良、懒惰、喜欢、厌恶、孤独、渴望、疯狂、爱、欲望、疯狂、忧郁、悲惨、吝啬、混乱、谦虚、喜怒无常、羞愧、迷惑、讨厌、恶心、消极、忽视、紧张、怀旧、麻木、固执、冒犯、乐观、愤怒、不知所措、恐慌、偏执、激情、耐心、沉思、困惑、坚持、悲观、怜悯、高兴、愉悦、礼貌、积极、占有欲、无能为力、自豪、不解、愤怒、皮疹、慌乱、后悔、拒绝、放松、松了一口气、不情愿、悔恨、怨恨、辞职、不安、厌恶、无情、悲伤、满意、害怕、幸灾乐祸、蔑视、自我照顾、自我同情、自信、自我意识、自我批评、自我厌恶、自我激励、自怜、自尊、自我理解、多愁善感、宁静、羞耻、无耻、震惊、自鸣得意、悲伤、怨恨、压力、坚强、固执、陷入困境、顺从、痛苦、闷闷不乐、惊讶、悬念、多疑、同情、温柔、紧张、恐惧、感激、激动、疲倦、宽容、折磨、胜利、困扰、信任、不确定、削弱、不安、不快乐、不安、不稳定、不确定、心烦意乱、报复、恶毒、警惕、脆弱、软弱、悲哀、担心、值得、愤怒。


这组词语并非旨在以任何方式完整或明确。使用尾部提示而不限制返回情绪描述符会引发一般性的含糊不清的反应,而这些反应无法直接提取情绪形式。

2.1.1. 估计情绪概率向量

LlaMa2 [2] 的发布方式允许开发人员访问响应提示返回的估计标记权重。LlaMa2 的内部词汇量约为 30,000 个标记。这意味着当 LlaMa 2 估计序列中下一个标记的概率时,概率向量将有 30,000 个元素。情绪描述符列表中的某些单词由多个标记组成,在这种情况下使用前向条件概率。


图 2.1.1 显示了由 Amazon 评论文本的尾部提示引发的情感词典中单词的缩放概率分布, “我阅读了很多关于 Fitbit inspire 2 的负面评论,我冒险尝试了一下,希望我订购的那款会是效果很好的产品之一。不幸的是,事实并非如此。我打开包装,给它充电,下载了应用程序。太阳下山前,我戴着它散步了。我手机上安装了 Google Fit 应用程序,也可以跟踪我的步数。手机在我的牛仔裤口袋里。回到家后,我比较了两者,Google Fit 说是 4,458 步,Fitbit 说是 1,168 步。显然,Fitbit 是通过手腕运动来工作的,而我在附近推着助行器时没有这种运动。我下载了手册,注意到你可以把它放在夹子上(不包括在内)。这对我来说没问题。因此,我开始滚动浏览不同的功能,但我无法滚动浏览所有功能。滚动时我必须打开秒表。我无法关闭它。然后,除了防水锁功能外,我无法滚动浏览任何其他内容。我不得不打开防水锁才能回到秒表。然后侧面按钮停止工作。我总共用了 5 个小时。我把它打包好,开始亚马逊退货。我确实得到了全额退款。非常令人失望。'


图 1:亚马逊评论中的情绪词典概率示例。词典中的单词按字母顺序排列。


亚马逊对一本书的 50 条评论中的文字来自 https://www.amazon.com/dp/B000WM9UK2。这些评论大部分都是正面的。示例评论文字包括: “《胡林之子》是一部伟大的悲剧,但也有其优雅之处。开头的家谱记录可能很难理解,但故事很快就加快了速度。我只给这个故事四颗星,因为前几章很难理解,就像马太福音开头的基督家谱一样。虽然这些记录对两者都很重要,但它们仍然很难理解。不过,我仍然会推荐这本书,因为它描绘了邪恶力量对善良男人和女人的可怕影响,然而,无论结局如何,我们都必须继续抵抗邪恶。在托尔金的世界里,在魔苟斯归来的末日,正是图林,一个男人,一劳永逸地结束了他的生命,这很能说明问题。撒旦在今生最想毁灭的人,是那些最终会给予他致命一击的人,正如启示录所说,“他们用羔羊的血和他们的‘殉道者’(见证、证词)的话语战胜了他”,就像图林那样的人,或者在圣经中,像约伯那样的人。’


图 2:亚马逊上针对一本书的 50 条评论的情感描述概率的叠加。


图 2.1.2 显示了所有 50 条处理后的评论的情绪向量。购买该产品后最有可能产生的 10 种情绪是:沮丧、善良、怀旧、疲倦、绝望、孤独、希望、平静、懒惰、自信。