paint-brush
VEATIC: Rastreamento de emoção e afeto baseado em vídeo em conjunto de dados de contexto: mais sobre estímulospor@kinetograph
193 leituras

VEATIC: Rastreamento de emoção e afeto baseado em vídeo em conjunto de dados de contexto: mais sobre estímulos

Muito longo; Para ler

Neste artigo, os pesquisadores apresentam o conjunto de dados VEATIC para reconhecimento de afeto humano, abordando as limitações dos conjuntos de dados existentes, permitindo inferência baseada no contexto.
featured image - VEATIC: Rastreamento de emoção e afeto baseado em vídeo em conjunto de dados de contexto: mais sobre estímulos
Kinetograph: The Video Editing Technology Publication HackerNoon profile picture
0-item

Este artigo está disponível no arxiv sob licença CC 4.0.

Autores:

(1) Zhihang Ren, Universidade da Califórnia, Berkeley e estes autores contribuíram igualmente para este trabalho (E-mail: [email protected]);

(2) Jefferson Ortega, Universidade da Califórnia, Berkeley e estes autores contribuíram igualmente para este trabalho (E-mail: [email protected]);

(3) Yifan Wang, Universidade da Califórnia, Berkeley e estes autores contribuíram igualmente para este trabalho (E-mail: [email protected]);

(4) Zhimin Chen, Universidade da Califórnia, Berkeley (E-mail: [email protected]);

(5) Yunhui Guo, Universidade do Texas em Dallas (E-mail: [email protected]);

(6) Stella X. Yu, Universidade da Califórnia, Berkeley e Universidade de Michigan, Ann Arbor (E-mail: [email protected]);

(7) David Whitney, Universidade da Califórnia, Berkeley (E-mail: [email protected]).

Tabela de links

7. Mais sobre estímulos

Todos os vídeos utilizados no conjunto de dados VEATIC foram selecionados de um site de compartilhamento de vídeos online (YouTube). O conjunto de dados VEATIC contém 124 videoclipes, 104 clipes de filmes de Hollywood, 15 clipes de vídeos caseiros e 5 clipes de documentários ou reality shows de TV. Especificamente, classificamos vídeos documentários como quaisquer vídeos que mostram interações sociais sinceras, mas possuem alguma forma de edição de vídeo, enquanto vídeos caseiros referem-se a vídeos que mostram interações sociais sinceras sem qualquer edição de vídeo. Todos os vídeos no conjunto de dados tinham uma taxa de quadros de 25 quadros por segundo e variavam em resolução, sendo a mais baixa 202 x 360 e a mais alta 1920 x 1080.


Exceto pela visão geral dos quadros de vídeo na Figura 2, mostramos mais exemplos na Figura 9. Além disso, diferentemente dos conjuntos de dados publicados anteriormente, onde a maioria dos quadros contém o caractere principal [31, 29, 32], o VEATIC não possui apenas quadros contendo o caractere selecionado, mas também há muitos quadros contendo personagens não selecionados e fundos puros (Figura 10). Portanto, o VEATIC é mais semelhante aos nossos cenários da vida diária, e os algoritmos treinados nele serão mais promissores para aplicações diárias.


Este artigo está disponível no arxiv sob licença CC 4.0.