Этот документ доступен на arxiv под лицензией CC 4.0.
Авторы:
(1) Д.Синклер, Imense Ltd и электронная почта: [email protected];
(2) WTPye, Уорикский университет, электронная почта: [email protected].
В этой статье показано, как LLM (модели большого языка) [5, 2] могут использоваться для оценки эмоционального состояния, связанного с фрагментом текста. Краткое изложение эмоционального состояния представляет собой словарь слов, используемых для описания эмоций, вместе с вероятностью появления слова после подсказки, состоящей из исходного текста и хвоста, вызывающего эмоцию. С помощью анализа эмоций обзоров продуктов Amazon мы демонстрируем, что дескрипторы эмоций могут быть отображены в пространстве типов PCA. Была надежда, что текстовые описания действий по улучшению текущего состояния, описанного текстом, также можно будет получить с помощью хвостовой подсказки. Эксперимент, казалось, показал, что заставить это работать не так-то просто. Эта неудача лишила нас надежды на выбор действия путем выбора наилучшего прогнозируемого результата путем сравнения эмоциональных реакций на данный момент вне досягаемости.
Ключевые слова: синтетическое сознание, вектор эмоций, словарь эмоций, вектор вероятности эмоций.
Поведение человека обязательно определяется эмоциями [3]. Воспринятая информация об окружающем нас мире должна быть согласована с нашим внутренним состоянием, и любое действие, которое необходимо предпринять, выбирается так, чтобы привести к будущему состоянию, которое кажется предпочтительным по сравнению с нашим текущим состоянием [4], где предпочтительное означает: «Я чувствую, что я бы хотел». хотелось бы попробовать новое состояние или действие, которое может привести к новому состоянию». Если мы голодны, мы часто решаем поесть. Если мы очень голодны, мы будем идти на больший риск, чтобы добыть еду. Если нам холодно, мы попытаемся согреться и т. д. Цель рекламы – убедить нас в том, что действия приведут к большему счастью. Сладкие газированные напитки объективно не приводят к долгосрочному счастью, но желательна известная краткосрочная эмоциональная реакция на употребление сахара. Полученные данные о мире чрезвычайно разнообразны, часто неточны и неполны, а требуемые ответы имеют разную степень срочности. Механизм арбитража, который обрабатывает эти входные данные, должен естественным образом справляться с неопределенностью, одновременно обеспечивая внутреннюю уверенность. Эмоции — это термин, который мы используем для описания нашего опыта использования этого аппарата для принятия решений. Фраза «компьютеры не обладают эмоциями» часто ошибочно используется для утверждения, что интерактивное компьютерное программное обеспечение, работающее на машине, никогда не может проявлять или испытывать эмоции. Модели большого языка (LLM) [5, 1, 2] предлагают готовые средства связи фрагмента текста с предполагаемым эмоциональным состоянием, устраняя разрыв между миром текста и сферой человеческих эмоций. LLM использовались в целенаправленном анализе настроений и, как сообщается, работают адекватно [6], но на момент написания нам неизвестно о других исследователях, использующих вероятностные словари эмоций.
В этой статье исследуется пересечение LLM и эмоций, демонстрируя, как эти модели можно использовать для оценки эмоционального содержания фрагмента текста. Мы представляем новый подход к обобщению эмоциональных состояний путем создания словаря слов, связанных с эмоциями, и расчета вероятности появления этих слов после подсказки, которая включает в себя как исходный текст, так и хвост, вызывающий эмоции. Данная методика позволяет количественно оценить эмоциональный ландшафт текста.
Чтобы продемонстрировать наш подход, мы выбираем словарь из 271 слова, описывающего эмоции, и оцениваем вероятность их ассоциации с разделами обзоров продуктов Amazon. Ограниченные вычислительные ресурсы и время означают, что мы можем опубликовать лишь поверхностное исследование. Вполне вероятно, что многие эмоции коррелируют, и оценку размера эмоционального пространства можно получить с помощью PCA-анализа на большой выборке векторов эмоций.
Мы обсуждаем некоторые ограничения, с которыми мы столкнулись во время эксперимента, а также некоторые препятствия на пути создания и регулирования поведения синтетического сознания, основанного на эмоциях.
Этот документ построен следующим образом: в разделе 2 подробно описан LLM и оборудование, используемое для его запуска, в разделе 2.1 подробно описан выбор слов для составления нашего словаря эмоций, в разделе 2.1.1 рассматривается оценка вероятностей эмоций из LLM с использованием хвостовой подсказки. В разделе 2.1.2 показаны результаты обзоров Amazon. Намек на структуру PCA с векторами эмоций дан в пункте 3. Наконец, рассматриваются будущие направления и даются выводы.