paint-brush
Estimar vetores de probabilidade de emoção usando LLMs: Resumo e introduçãopor@textmodels
261 leituras

Estimar vetores de probabilidade de emoção usando LLMs: Resumo e introdução

Muito longo; Para ler

Este artigo mostra como LLMs (Large Language Models) [5, 2] podem ser usados para estimar um resumo do estado emocional associado a um trecho de texto.
featured image - Estimar vetores de probabilidade de emoção usando LLMs: Resumo e introdução
Writings, Papers and Blogs on Text Models HackerNoon profile picture
0-item

Este artigo está disponível no arxiv sob licença CC 4.0.

Autores:

(1) D.Sinclair, Imense Ltd, e e-mail: [email protected];

(2) WTPye, Warwick University e e-mail: [email protected].

Tabela de links

Abstrato

Este artigo mostra como LLMs (Large Language Models) [5, 2] podem ser usados para estimar um resumo do estado emocional associado a um trecho de texto. O resumo do estado emocional é um dicionário de palavras usadas para descrever a emoção juntamente com a probabilidade de a palavra aparecer após um prompt que compreende o texto original e uma cauda que provoca emoção. Por meio da análise emocional de análises de produtos da Amazon, demonstramos que os descritores de emoções podem ser mapeados em um espaço do tipo PCA. Esperava-se que as descrições textuais de ações para melhorar um estado atual descrito no texto também pudessem ser obtidas por meio de um prompt final. A experiência pareceu indicar que não é fácil fazer isso funcionar. Este fracasso colocou a nossa esperança de seleção de ação através da escolha do melhor resultado previsto através da comparação de respostas emocionais fora do alcance no momento.


Palavras-chave: consciência sintética, vetor de emoções, dicionário de emoções, vetor de probabilidade de emoções

1. Introdução

O comportamento humano é necessariamente governado pela emoção [3]. A informação sentida sobre o mundo que nos rodeia tem de ser reconciliada com o nosso estado interno e qualquer ação a ser tomada é escolhida de modo a levar a um estado futuro que pareça preferível ao nosso estado atual [4], onde preferível significa 'meu sentimento é que eu gostaria gostaria de experimentar o novo estado ou a acção que possivelmente conduza a um novo estado”. Se estivermos com fome, muitas vezes escolheremos comer. Se tivermos muita fome correremos maiores riscos para adquirir alimentos. Se estivermos com frio, tentaremos nos aquecer, etc. A publicidade visa nos convencer de que um curso de ação levará a mais felicidade. As bebidas carbonatadas açucaradas não levam objetivamente à felicidade a longo prazo, mas a conhecida resposta emocional de curto prazo à ingestão de açúcar é desejável. Os dados detectados sobre o mundo são tremendamente diversos, muitas vezes imprecisos e incompletos, e as respostas exigidas têm vários graus de urgência. O mecanismo de arbitragem que processa essas informações precisa lidar naturalmente com a imprecisão, ao mesmo tempo que parece fornecer certeza internamente. Emoções é o termo que usamos para descrever nossa experiência ao usar esse aparato para tomar decisões. A frase computadores não têm emoções é muitas vezes usada erroneamente para afirmar que o software de computador interativo executado em uma máquina nunca pode exibir ou experimentar emoções. Grandes Modelos de Linguagem (LLMs) [5, 1, 2] oferecem um meio pronto de vincular um pedaço de texto a um estado emocional estimado, preenchendo a lacuna entre o mundo do texto e o domínio da emoção humana. Os LLMs têm sido usados na análise de sentimento focada e são relatados como tendo um desempenho adequado [6], mas no momento em que este artigo foi escrito, não tínhamos conhecimento de outros pesquisadores que usassem dicionários probabilísticos de emoções.


Este artigo explora a intersecção entre LLMs e emoções, demonstrando como esses modelos podem ser aproveitados para estimar o conteúdo emocional de um trecho de texto. Apresentamos uma nova abordagem para resumir estados emocionais, construindo um dicionário de palavras relacionadas à emoção e calculando as probabilidades dessas palavras aparecerem seguindo um prompt que inclui tanto o texto original quanto uma cauda que provoca emoção. Esta metodologia nos permite avaliar quantitativamente a paisagem emocional do texto.


Para demonstrar nossa abordagem, escolhemos um dicionário de 271 palavras que descrevem emoções e estimamos sua probabilidade de serem associadas a uma seção de análises de produtos da Amazon. Recursos computacionais e tempo limitados significam que só estamos em condições de publicar um estudo superficial. É provável que muitas emoções estejam correlacionadas e uma estimativa da dimensão do espaço emocional possa ser derivável através da análise PCA numa grande amostra de vetores de emoção.


Discutimos algumas das limitações que encontramos durante o experimento e alguns dos obstáculos à produção e regulação do comportamento da consciência sintética baseada na emoção.


Este artigo é apresentado da seguinte forma, a seção 2 detalha o LLM e o hardware usado para executá-lo, a seção 2.1 detalha nossas escolhas de palavras para compor nosso dicionário de emoções, a seção 2.1.1 cobre a estimativa de probabilidades de emoção de um LLM usando um prompt final. A seção 2.1.2 mostra os resultados das análises da Amazon. Uma dica sobre a estrutura do PCA com vetores de emoção é dada em 3. Finalmente, as direções futuras são consideradas e as conclusões são fornecidas.