paint-brush
Detección de violencia en videos: resumenpor@kinetograph

Detección de violencia en videos: resumen

Demasiado Largo; Para Leer

En este artículo, los investigadores proponen un sistema para la detección automática de violencia en videos, utilizando señales de audio y visuales para la clasificación.
featured image - Detección de violencia en videos: resumen
Kinetograph: The Video Editing Technology Publication HackerNoon profile picture
0-item


Autores:

(1) Praveen Tirupattur, Universidad de Florida Central.

Tabla de enlaces

Abstracto

En los últimos años, ha habido un enorme aumento en la cantidad de contenido de vídeo subido a redes sociales y sitios web para compartir vídeos como Facebook y Youtube. Como resultado de esto, también aumentó el riesgo de que los niños queden expuestos a contenido para adultos y violento en la web. Para abordar este problema, en este trabajo se propone un enfoque para detectar automáticamente contenido violento en videos. Aquí se hace también un novedoso intento de detectar la categoría de violencia presente en un vídeo. Un sistema que pueda detectar automáticamente la violencia tanto en películas de Hollywood como en vídeos de la web es extremadamente útil no sólo en el control parental sino también para aplicaciones relacionadas con clasificaciones de películas, videovigilancia, clasificación de géneros, etc.


Aquí, se utilizan funciones tanto de audio como visuales para detectar la violencia. Las funciones de MFCC se utilizan como señales de audio. Las funciones Blood, Motion y SentiBank se utilizan como señales visuales. Los clasificadores binarios SVM están capacitados en cada una de estas características para detectar violencia. Se realiza una fusión tardía utilizando una suma ponderada de puntuaciones de clasificación para obtener puntuaciones de clasificación finales para cada una de las clases de violencia objetivo del sistema. Para determinar las ponderaciones óptimas para cada una de las clases de violencia, se emplea un enfoque basado en la búsqueda en cuadrícula. Los conjuntos de datos disponibles públicamente, principalmente la Detección de escenas violentas (VSD), se utilizan para el entrenamiento de clasificadores, el cálculo de peso y las pruebas. El rendimiento del sistema se evalúa en dos tareas de clasificación, clasificación multiclase y clasificación binaria. Los resultados obtenidos para la Clasificación Binaria son mejores que los resultados de referencia de MediaEval-2014.


Este documento está disponible en arxiv bajo licencia CC 4.0.