paint-brush
Estimer les vecteurs de probabilité d'émotion à l'aide de LLM : résumé et introductionpar@textmodels
362 lectures
362 lectures

Estimer les vecteurs de probabilité d'émotion à l'aide de LLM : résumé et introduction

Trop long; Pour lire

Cet article montre comment les LLM (Large Language Models) [5, 2] peuvent être utilisés pour estimer un résumé de l'état émotionnel associé à un morceau de texte.
featured image - Estimer les vecteurs de probabilité d'émotion à l'aide de LLM : résumé et introduction
Writings, Papers and Blogs on Text Models HackerNoon profile picture
0-item

Cet article est disponible sur arxiv sous licence CC 4.0.

Auteurs:

(1) D.Sinclair, Imense Ltd, et email : [email protected] ;

(2) WTPye, Warwick University, et e-mail : [email protected].

Tableau des liens

Abstrait

Cet article montre comment les LLM (Large Language Models) [5, 2] peuvent être utilisés pour estimer un résumé de l'état émotionnel associé à un morceau de texte. Le résumé de l'état émotionnel est un dictionnaire de mots utilisés pour décrire l'émotion ainsi que la probabilité que le mot apparaisse après une invite comprenant le texte original et une queue suscitant l'émotion. Grâce à l'analyse des émotions des avis sur les produits Amazon, nous démontrons que les descripteurs d'émotion peuvent être cartographiés dans un espace de type PCA. On espérait que des descriptions textuelles d'actions visant à améliorer un état actuel décrit dans un texte pourraient également être obtenues via une invite de fin. L’expérience semble indiquer que cela n’est pas simple à mettre en œuvre. Cet échec a mis hors de portée pour le moment notre sélection d’action espérée en choisissant le résultat le mieux prévu en comparant les réponses émotionnelles.


Mots-clés : conscience synthétique, vecteur d'émotion, dictionnaire d'émotion, vecteur de probabilité d'émotion

1. Introduction

Le comportement humain est nécessairement régi par l'émotion [3]. Les informations perçues sur le monde qui nous entoure doivent être réconciliées avec notre état interne et toute action à entreprendre est choisie de manière à conduire à un état futur qui semble préférable à notre état actuel [4], où préférable signifie « mon sentiment est que je le ferais ». j'aime essayer le nouvel état ou l'action menant éventuellement à un nouvel état ». Si nous avons faim, nous choisirons souvent de manger. Si nous avons très faim, nous prendrons plus de risques pour acquérir de la nourriture. Si nous avons froid, nous essaierons de nous réchauffer, etc. La publicité vise à nous convaincre qu’une ligne d’action mènera à plus de bonheur. Les boissons gazeuses sucrées ne conduisent pas objectivement au bonheur à long terme, mais la réponse émotionnelle connue à court terme à la consommation de sucre est souhaitable. Les données recueillies sur le monde sont extrêmement diverses, souvent inexactes et incomplètes, et les réponses requises présentent des degrés d'urgence variables. Le moteur d’arbitrage qui traite ces entrées doit naturellement faire face au flou tout en semblant apporter une certitude en interne. Les émotions sont le terme que nous utilisons pour décrire notre expérience d’utilisation de cet appareil pour prendre des décisions. L’expression « les ordinateurs n’ont pas d’émotions » est souvent utilisée à tort pour affirmer que les logiciels informatiques interactifs exécutés sur une machine ne peuvent jamais manifester ou ressentir d’émotions. Les grands modèles linguistiques (LLM) [5, 1, 2] offrent un moyen facile de relier un morceau de texte à un état émotionnel estimé, comblant ainsi le fossé entre le monde du texte et le domaine de l'émotion humaine. Les LLM ont été utilisés dans l'analyse ciblée des sentiments et semblent fonctionner de manière adéquate [6], mais au moment de la rédaction de cet article, nous ne connaissons pas d'autres chercheurs utilisant des dictionnaires probabilistes d'émotions.


Cet article explore l'intersection des LLM et des émotions, démontrant comment ces modèles peuvent être exploités pour estimer le contenu émotionnel d'un morceau de texte. Nous présentons une nouvelle approche pour résumer les états émotionnels en construisant un dictionnaire de mots liés aux émotions et en calculant les probabilités d'apparition de ces mots à la suite d'une invite comprenant à la fois le texte original et une queue suscitant l'émotion. Cette méthodologie nous permet d'évaluer quantitativement le paysage émotionnel du texte.


Pour démontrer notre approche, nous choisissons un dictionnaire de 271 mots décrivant des émotions et estimons leur probabilité d'être associés à une section d'avis sur les produits Amazon. Les ressources informatiques et le temps limités signifient que nous ne sommes en mesure de publier qu’une étude superficielle. Il est probable que de nombreuses émotions soient corrélées et qu’une estimation de la dimension de l’espace émotionnel puisse être dérivée via une analyse PCA sur un large échantillon de vecteurs d’émotion.


Nous discutons de certaines des limitations que nous avons rencontrées au cours de l'expérience et de certains des obstacles à la production et à la régulation du comportement d'une conscience synthétique basée sur les émotions.


Cet article est présenté comme suit, la section 2 détaille le LLM et le matériel utilisé pour l'exécuter, la section 2.1 détaille nos choix de mots pour constituer notre dictionnaire des émotions, la section 2.1.1 couvre l'estimation des probabilités d'émotion à partir d'un LLM à l'aide d'une invite de queue. La section 2.1.2 présente les résultats des avis Amazon. Un indice sur la structure de l'ACP avec des vecteurs d'émotion est donné en 3. Enfin, les orientations futures sont examinées et la conclusion est donnée.