この論文はCC 4.0ライセンスの下でarxivで公開されています。
著者:
(1)D.Sinclair、Imense Ltd、電子メール:[email protected]
(2)WTPye、ウォーリック大学、メールアドレス:[email protected]。
この論文では、LLM(大規模言語モデル)[5, 2]を使用して、テキストに関連付けられた感情状態の要約を推定する方法を示します。感情状態の要約は、感情を説明するために使用される単語の辞書であり、元のテキストと感情を引き出すテールを含むプロンプトの後に単語が出現する確率が含まれています。Amazon製品レビューの感情分析を通じて、感情記述子をPCAタイプのスペースにマッピングできることを実証します。現在のテキストで説明されている状態を改善するためのアクションのテキスト説明も、テールプロンプトを通じて引き出すことができると期待されていました。実験では、これが機能するのは簡単ではないことが示されたようです。この失敗により、感情的な反応を比較して予測される最良の結果を選択することによるアクションの選択という私たちの期待は、現時点では手の届かないものになりました。
キーワード:合成意識、感情ベクトル、感情辞書、感情確率ベクトル
人間の行動は必然的に感情によって左右される [3]。周囲の世界に関する感知情報は、私たちの内部状態と調和されなければならず、取られるべき行動は、現在の状態よりも望ましいと思われる将来の状態につながるように選択される [4]。ここで、望ましいとは、「新しい状態、または新しい状態につながる可能性のある行動を試してみたいという私の気持ち」を意味する。空腹であれば、私たちは食べることを選択することが多い。非常に空腹であれば、食べ物を手に入れるために大きなリスクを負う。寒ければ、暖まろうとするなどである。広告は、ある行動がより多くの幸福につながると私たちを説得することを目的としている。甘い炭酸飲料は客観的には長期的な幸福につながらないが、砂糖を食べることに対する既知の短期的な感情的反応は望ましい。世界に関する感知データは非常に多様で、しばしば不正確で不完全であり、必要な反応にはさまざまな緊急度がある。これらの入力を処理する調停エンジンは、内部的には確実性を提供しているように見えながら、あいまいさに自然に対処しなければならない。感情とは、この装置を使用して意思決定を行う経験を説明するために使用する用語である。コンピュータには感情がないという表現は、機械上で動作する対話型コンピュータソフトウェアは感情を示したり経験したりできないと主張するために誤って使用されることが多い。大規模言語モデル(LLM)[5、1、2]は、テキストの塊を推定された感情状態にリンクする簡単な手段を提供し、テキストの世界と人間の感情の領域との間のギャップを埋める。LLMは集中的な感情分析に使用されており、適切に機能すると報告されている[6]が、執筆時点では、確率的感情辞書を使用している他の研究者を私たちは知らない。
この論文では、LLM と感情の交わりを探り、これらのモデルを利用してテキストの感情的内容を推定する方法を示します。感情に関連する単語の辞書を作成し、元のテキストと感情を喚起する末尾の両方を含むプロンプトの後にこれらの単語が出現する確率を計算することで、感情状態を要約する新しいアプローチを紹介します。この方法論により、テキストの感情的ランドスケープを定量的に評価できます。
私たちのアプローチを実証するために、感情を表す 271 語の辞書を選択し、Amazon 製品レビューのセクションに関連付けられる可能性を推定します。計算リソースと時間が限られているため、大まかな研究しか公開できません。多くの感情は相関関係にある可能性があり、感情空間の次元の推定値は、感情ベクトルの大規模なサンプルに対する PCA 分析によって導き出せる可能性があります。
私たちは、実験中に遭遇したいくつかの制限と、感情に基づく合成意識の行動を生み出し、制御する上でのいくつかの障害について説明します。
この論文は次のように構成されています。セクション 2 では LLM とそれを実行するために使用されるハードウェアについて詳しく説明し、セクション 2.1 では感情辞書を構成する単語の選択について詳しく説明し、セクション 2.1.1 ではテール プロンプトを使用して LLM から感情確率を推定する方法について説明します。セクション 2.1.2 では Amazon レビューの結果を示します。感情ベクトル内の PCA 構造のヒントはセクション 3 で示されます。最後に将来の方向性について検討し、結論を示します。