この論文はCC 4.0ライセンスの下でarxivで公開されています。
著者:
(1)カリフォルニア大学バークレー校のZhihang Renとこれらの著者らは本研究に等しく貢献した(電子メール:[email protected])。
(2)ジェファーソン・オルテガ、カリフォルニア大学バークレー校およびこれらの著者らは、本研究に等しく貢献した(電子メール:[email protected])。
(3)Yifan Wang、カリフォルニア大学バークレー校およびこれらの著者らは、本研究に等しく貢献した(Eメール:[email protected])。
(4)カリフォルニア大学バークレー校のZhimin Chen氏(Eメール:[email protected])
(5)ユンフイ・グオ、テキサス大学ダラス校(Eメール:[email protected])
(6)ステラ・X・ユー、カリフォルニア大学バークレー校およびミシガン大学アナーバー校(Eメール:[email protected])
(7)デイビッド・ホイットニー、カリフォルニア大学バークレー校(Eメール:[email protected])。
人間が他人の感情を推測する方法を理解することは、研究者が社会的認知を理解する上で不可欠です。心理物理学者は実験を行いますが、実験を設計するために特定の刺激セットが必要です。しかし、公開されているデータセットの中には、連続的な感情価と覚醒度の評価を含むコンテキストベースのビデオデータセットは現在ありません。この種のデータセットが不足しているため、研究者は対応するタスク用のコンピュータービジョンアルゴリズムを開発できません。私たちが提案する VEATIC データセットは、コンピュータービジョンの分野におけるこの重要なギャップを埋め、感情認識を理解するための心理物理学的研究に役立つでしょう。D
データ収集中、参加者はビデオクリップ内のターゲットキャラクターの感情を継続的に追跡し、評価しました。これは、応答が遅れて収集される一般的な心理物理学的実験とは異なります。データセットのこの設計は、人間が日常生活で感情を処理するときに発生するリアルタイムの感情処理を模倣するために不可欠でした。さらに、感情処理は即時のプロセスではなく、他の人の感情について正確な推論を行うために、時間の経過に伴う情報の蓄積に大きく依存しています。
VEATIC データセットの強みは、人間が現実世界で感情を認識する方法を模倣していることです。つまり、時間領域と空間領域の両方で継続的に、コンテキスト情報が存在する状態で感情を認識することです。このような豊富なデータセットは、将来のコンピューター ビジョン モデルにとって不可欠であり、現在のモデルが達成できる限界を押し広げることができます。VEATIC のようなより豊富なデータセットが作成されると、将来のコンピューター ビジョン モデルは、人間と対話しながらリアルタイムで感情を認識できるようになるかもしれません。
この論文はCC 4.0ライセンスの下でarxivで公開されています。