paint-brush
Estimar vectores de probabilidad de emociones mediante LLM: resumen e introducciónpor@textmodels
362 lecturas
362 lecturas

Estimar vectores de probabilidad de emociones mediante LLM: resumen e introducción

Demasiado Largo; Para Leer

Este artículo muestra cómo se pueden utilizar los LLM (modelos de lenguaje grande) [5, 2] para estimar un resumen del estado emocional asociado con un fragmento de texto.
featured image - Estimar vectores de probabilidad de emociones mediante LLM: resumen e introducción
Writings, Papers and Blogs on Text Models HackerNoon profile picture
0-item

Este documento está disponible en arxiv bajo licencia CC 4.0.

Autores:

(1) D.Sinclair, Imense Ltd y correo electrónico: [email protected];

(2) WTPye, Universidad de Warwick y correo electrónico: [email protected].

Tabla de enlaces

Abstracto

Este artículo muestra cómo se pueden utilizar los LLM (modelos de lenguaje grande) [5, 2] para estimar un resumen del estado emocional asociado con un fragmento de texto. El resumen del estado emocional es un diccionario de palabras que se utiliza para describir la emoción junto con la probabilidad de que la palabra aparezca después de una indicación que comprende el texto original y una cola que provoca la emoción. A través del análisis de emociones de las reseñas de productos de Amazon, demostramos que los descriptores de emociones se pueden asignar a un espacio tipo PCA. Se esperaba que las descripciones textuales de acciones para mejorar un estado actual descrito en el texto también pudieran obtenerse a través de un mensaje final. Los experimentos parecían indicar que no es sencillo hacer que esto funcione. Este fracaso puso nuestra esperanza de selección de acción mediante la elección del mejor resultado previsto mediante la comparación de respuestas emocionales fuera de nuestro alcance por el momento.


Palabras clave: conciencia sintética, vector de emoción, diccionario de emociones, vector de probabilidad de emoción

1. Introducción

El comportamiento humano está necesariamente gobernado por la emoción [3]. La información percibida sobre el mundo que nos rodea debe reconciliarse con nuestro estado interno y cualquier acción a tomar se elige de manera que conduzca a un estado futuro que parezca preferible a nuestro estado actual [4], donde preferible significa "mi sensación es que lo haría". "Me gustaría probar el nuevo estado o la acción que posiblemente conduzca a un nuevo estado". Si tenemos hambre, a menudo optaremos por comer. Si tenemos mucha hambre correremos mayor riesgo para adquirir alimentos. Si tenemos frío, intentaremos calentarnos, etc. La publicidad tiene como objetivo convencernos de que un curso de acción nos conducirá a una mayor felicidad. Las bebidas carbonatadas azucaradas no conducen objetivamente a la felicidad a largo plazo, pero es deseable la conocida respuesta emocional a corto plazo al comer azúcar. Los datos percibidos sobre el mundo son tremendamente diversos, a menudo inexactos e incompletos, y las respuestas requeridas tienen distintos grados de urgencia. El motor de arbitraje que procesa estos datos necesita lidiar naturalmente con la vaguedad y, al mismo tiempo, parecer brindar certeza internamente. Las emociones son el término que utilizamos para describir nuestra experiencia al utilizar este aparato para tomar decisiones. La frase que las computadoras no tienen emociones a menudo se usa erróneamente para afirmar que el software interactivo que se ejecuta en una máquina nunca puede exhibir ni experimentar emociones. Los modelos de lenguaje grande (LLM) [5, 1, 2] ofrecen un medio fácil de vincular un fragmento de texto con un estado emocional estimado, cerrando la brecha entre el mundo del texto y el ámbito de las emociones humanas. Los LLM se han utilizado en el análisis de sentimientos enfocado y se informa que funcionan adecuadamente [6] pero en el momento de escribir este artículo no conocemos que otros investigadores utilicen diccionarios de emociones probabilísticas.


Este artículo explora la intersección de los LLM y las emociones, demostrando cómo se pueden aprovechar estos modelos para estimar el contenido emocional de un texto. Presentamos un enfoque novedoso para resumir estados emocionales mediante la construcción de un diccionario de palabras relacionadas con emociones y calculando las probabilidades de que estas palabras aparezcan después de una indicación que incluye tanto el texto original como una cola que provoca emociones. Esta metodología nos permite evaluar cuantitativamente el panorama emocional del texto.


Para demostrar nuestro enfoque, elegimos un diccionario de 271 palabras que describen emociones y estimamos su probabilidad de estar asociadas con una sección de reseñas de productos de Amazon. Los recursos computacionales y el tiempo limitados significan que solo estamos en condiciones de publicar un estudio superficial. Es probable que muchas emociones estén correlacionadas y se pueda derivar una estimación de la dimensión del espacio emocional mediante el análisis PCA en una muestra grande de vectores de emociones.


Discutimos algunas de las limitaciones que encontramos durante el experimento y algunos de los obstáculos para producir y regular el comportamiento de la conciencia sintética basada en emociones.


Este documento se presenta de la siguiente manera, la sección 2 detalla el LLM y el hardware utilizado para ejecutarlo, la sección 2.1 detalla nuestras elecciones de palabras para componer nuestro diccionario de emociones, la sección 2.1.1 cubre la estimación de probabilidades de emoción de un LLM usando un mensaje de cola. La sección 2.1.2 muestra los resultados de las reseñas de Amazon. En 3 se da una pista sobre la estructura PCA con vectores de emoción. Finalmente, se consideran las direcciones futuras y se dan conclusiones.