Autoren:
(1) Praveen Tirupattur, University of Central Florida.
In den letzten Jahren hat die Menge an Videoinhalten, die auf soziale Netzwerke und Video-Sharing-Websites wie Facebook und YouTube hochgeladen werden, enorm zugenommen. Dadurch ist auch das Risiko gestiegen, dass Kinder im Internet mit gewalttätigen Inhalten für Erwachsene konfrontiert werden. Um dieses Problem anzugehen, wird in dieser Arbeit ein Ansatz zur automatischen Erkennung gewalttätiger Inhalte in Videos vorgeschlagen. Dabei wird ein neuartiger Versuch unternommen, auch die in einem Video vorhandene Gewaltkategorie zu erkennen. Ein System, das Gewalt sowohl in Hollywood-Filmen als auch in Videos aus dem Internet automatisch erkennen kann, ist nicht nur für die Kindersicherung, sondern auch für Anwendungen im Zusammenhang mit Filmbewertungen, Videoüberwachung, Genreklassifizierung usw. äußerst nützlich.
Hier werden sowohl Audio- als auch visuelle Merkmale verwendet, um Gewalt zu erkennen. MFCC-Merkmale werden als Audiohinweise verwendet. Blut-, Bewegungs- und SentiBank-Merkmale werden als visuelle Hinweise verwendet. Binäre SVM-Klassifikatoren werden anhand jedes dieser Merkmale trainiert, um Gewalt zu erkennen. Eine späte Fusion unter Verwendung einer gewichteten Summe von Klassifizierungswerten wird durchgeführt, um endgültige Klassifizierungsergebnisse für jede der vom System anvisierten Gewaltklassen zu erhalten. Um optimale Gewichte für jede der Gewaltklassen zu bestimmen, wird ein auf Rastersuche basierender Ansatz verwendet. Öffentlich verfügbare Datensätze, hauptsächlich Gewaltszenenerkennung (Violent Scene Detection, VSD), werden für das Training des Klassifikators, die Berechnung der Gewichte und das Testen verwendet. Die Leistung des Systems wird anhand von zwei Klassifizierungsaufgaben bewertet: Mehrklassenklassifizierung und binäre Klassifizierung. Die für die binäre Klassifizierung erzielten Ergebnisse sind besser als die Basisergebnisse von MediaEval-2014.
Dieses Dokument ist auf Arxiv unter der CC 4.0-Lizenz verfügbar .