저자:
(1) 센트럴 플로리다 대학교 Praveen Tirupattur.
최근 몇 년 동안 Facebook, Youtube 등 소셜 네트워킹 및 동영상 공유 웹사이트에 업로드되는 동영상 콘텐츠의 양이 엄청나게 증가했습니다. 그 결과, 어린이들이 웹상의 성인물 및 폭력적인 콘텐츠에 노출될 위험도 증가했습니다. 이 문제를 해결하기 위해 본 연구에서는 비디오에서 폭력적인 콘텐츠를 자동으로 감지하는 접근 방식을 제안합니다. 여기서도 영상에 존재하는 폭력의 범주를 탐지하려는 새로운 시도가 이루어졌다. 할리우드 영화와 웹 비디오 모두에서 폭력을 자동으로 감지할 수 있는 시스템은 자녀 보호뿐만 아니라 영화 등급, 비디오 감시, 장르 분류 등과 관련된 응용 프로그램에도 매우 유용합니다.
여기서는 폭력을 감지하기 위해 오디오 및 시각적 기능이 모두 사용됩니다. MFCC 기능은 오디오 신호로 사용됩니다. Blood, Motion 및 SentiBank 기능은 시각적 단서로 사용됩니다. 이진 SVM 분류기는 폭력을 감지하기 위해 이러한 각 기능에 대해 훈련됩니다. 분류 점수의 가중합을 이용한 후기 융합을 수행하여 시스템이 대상으로 하는 각 폭력 등급에 대한 최종 분류 점수를 얻는다. 각 폭력 클래스에 대한 최적의 가중치를 결정하기 위해 그리드 검색에 기반한 접근 방식이 사용됩니다. 주로 VSD(폭력 장면 감지)와 같은 공개적으로 사용 가능한 데이터 세트는 분류기 훈련, 가중치 계산 및 테스트에 사용됩니다. 시스템 성능은 다중 클래스 분류와 이진 분류라는 두 가지 분류 작업에 대해 평가됩니다. 이진 분류를 통해 얻은 결과는 MediaEval-2014의 기준 결과보다 낫습니다.
이 문서는 CC 4.0 라이선스에 따라 arxiv에서 볼 수 있습니다.