paint-brush
VEATIC: 비디오 기반 감정 및 맥락 데이터 세트의 영향 추적: 비디오 전반의 주제 일치~에 의해@kinetograph
328 판독값
328 판독값

VEATIC: 비디오 기반 감정 및 맥락 데이터 세트의 영향 추적: 비디오 전반의 주제 일치

너무 오래; 읽다

본 논문에서 연구자들은 인간 감정 인식을 위한 VEATIC 데이터 세트를 소개하여 기존 데이터 세트의 한계를 해결하고 상황 기반 추론을 가능하게 합니다.
featured image - VEATIC: 비디오 기반 감정 및 맥락 데이터 세트의 영향 추적: 비디오 전반의 주제 일치
Kinetograph: The Video Editing Technology Publication HackerNoon profile picture
0-item

이 문서는 CC 4.0 라이선스에 따라 arxiv에서 볼 수 있습니다.

저자:

(1) 캘리포니아 대학교 버클리 캠퍼스의 Zhihang Ren과 이들 저자는 이 연구에 동등하게 기여했습니다(이메일: [email protected]).

(2) 캘리포니아 대학교 버클리 캠퍼스의 Jefferson Ortega와 이들 저자는 이 작업에 동등하게 기여했습니다(이메일: [email protected]).

(3) University of California, Berkeley의 Yifan Wang과 이들 저자는 이 연구에 동등하게 기여했습니다(이메일: [email protected]).

(4) 캘리포니아 버클리 대학교 Zhimin Chen(이메일: [email protected]);

(5) 댈러스 텍사스 대학교 Yunhui Guo (이메일: [email protected]);

(6) Stella X. Yu, University of California, Berkeley 및 University of Michigan, Ann Arbor (이메일: [email protected]);

(7) David Whitney, University of California, Berkeley (이메일: [email protected]).

링크 표

10. 동영상 전반의 주제 일치

VEATIC 데이터세트의 장점은 각 비디오에 대해 주석자가 여러 개 있고 특정 비디오에 대한 주석자가 최소 25개이고 최대 주석자가 73개라는 것입니다. 감정 인식은 주관적이며 관찰자의 판단은 여러 사람에 따라 다를 수 있습니다. 이전에 게시된 감정 데이터세트 중 상당수는 주석자 수가 매우 적으며, 종종 한 자릿수(n < 10)의 주석자만 포함합니다. 주석자가 너무 적으면 관찰자 간의 분산이 증가하기 때문에 문제가 됩니다. 이를 보여주기 위해 우리는 모든 주석자에 대해 5개의 주석을 교체하여 무작위로 샘플링한 경우 데이터 세트의 각 비디오에 대한 평균 등급이 어떻게 달라지는지 계산했습니다. 각 영상에 대해 이 과정을 1000번 반복하고 다시 계산된 평균 평점의 표준편차를 계산했습니다. 그림 12a는 각 비디오에 5개 또는 모든 주석을 사용하는 경우 비디오 전반에 걸친 합의 등급의 표준 편차가 어떻게 달라지는지 보여줍니다. 이 분석은 주석자가 많을수록 합의 등급의 표준 편차가 훨씬 작아지고 비디오에서 실제 감정을 더 정확하게 표현할 수 있음을 보여줍니다.


그림 9. VEATIC의 추가 샘플 비디오 프레임. VEATIC의 비디오 클립에는 다양한 배경, 조명 조건, 캐릭터 상호 작용 등이 포함되어 있어 감정 인식 작업뿐만 아니라 기타 비디오 이해 작업을 위한 포괄적인 데이터 세트가 됩니다.


그림 10. VEATIC에서 선택되지 않은 캐릭터와 순수한 배경의 샘플 비디오 프레임. 각 행의 첫 번째 샘플 프레임에는 선택한 문자가 표시됩니다. 나머지 샘플 프레임은 선택되지 않은 문자이거나 순수한 배경입니다.


또한 각 비디오에 대한 관찰자의 표준 편차를 계산하여 비디오에 따라 관찰자의 반응이 어떻게 다른지 조사했습니다. 그림 12b는 비디오 간의 표준 편차를 보여줍니다. 우리는 원자가와 각성 차원 모두에 대한 표준 편차가 작았으며, 평균 표준 편차는 μ = 0.248, 중앙값은 0.222, 각성은 평균 표준 편차가 μ = 0.248, 중앙값 0.244로 비슷했습니다. EMOTIC [32]의 원자가 및 각성 등급 차이를 사용합니다.


이 문서는 CC 4.0 라이선스에 따라 arxiv에서 볼 수 있습니다.