118 okumalar

Videolarda Şiddet Tespiti: Sonuçlar ve Gelecekteki Çalışmalar

ile Kinetograph: The Video Editing Technology Publication4m2024/06/01

Çok uzun; Okumak

Bu makalede araştırmacılar, sınıflandırma için sesli ve görsel ipuçlarından yararlanarak videolardaki şiddetin otomatik olarak tespit edilmesine yönelik bir sistem önermektedir.

featured image - Videolarda Şiddet Tespiti: Sonuçlar ve Gelecekteki Çalışmalar

Yazarlar:

(1) Praveen Tirupattur, Central Florida Üniversitesi.

Bağlantı Tablosu

5. Sonuçlar ve Gelecekteki Çalışmalar

Bu bölümde, mevcut çalışmanın genişletilebileceği sonuçlar ve yönler sırasıyla Bölüm 5.1 ve Bölüm 5.2'de tartışılmaktadır.

5.1. Sonuçlar

Bu çalışmada hem görsel hem de işitsel özellikler kullanılarak videolarda şiddet içeren içeriklerin tespit edilmesini sağlayacak bir sistem geliştirilmeye çalışılmıştır. Bu çalışmada kullanılan yaklaşım, her ne kadar bu alanda daha önce yapılan çalışmalardan esinlenilmiş olsa da, kendine özgü yönleri şunlardır: (i) Farklı şiddet sınıflarının tespiti, (ii) SentiBank özelliğinin görsel içeriği tanımlamak için kullanılması. bir video, (iii) Kan dedektörü ve web'deki görüntüler kullanılarak geliştirilen kan modeli ve (iv) hareket özellikleri oluşturmak için video codec bileşeninden alınan bilgilerin kullanılması. Burada bu sistemi geliştirmek için kullanılan sürece kısa bir genel bakış yer almaktadır.

Şiddet fiziksel bir varlık olmadığından videoda tespit edilmesi kolay bir iş değildir. Şiddet görsel bir kavramdır ve onu tespit etmek için birden fazla özelliğin kullanılması gerekmektedir. Bu çalışmada ses içeriğini tanımlamak için MFCC özellikleri, görsel içeriği tanımlamak için ise Blood, Motion ve SentiBank özellikleri kullanılmıştır. SVM sınıflandırıcıları seçilen özelliklerin her biri için eğitildi ve bireysel sınıflandırıcı puanları, şiddet sınıflarının her biri için nihai sınıflandırma puanlarını elde etmek üzere ağırlıklı toplamla birleştirildi. Her sınıfın ağırlıkları, minimum EER olacak şekilde optimizasyon kriterlerine sahip bir ızgara arama yaklaşımı kullanılarak bulunur. Bu çalışmada farklı veri setleri kullanılmıştır ancak en önemlisi sınıflandırıcıların eğitimi, sınıflandırıcı ağırlıklarının hesaplanması ve sistemin test edilmesi için kullanılan VSD veri setidir.

Sistemin performansı MultiClass ve Binary sınıflandırma olmak üzere iki farklı sınıflandırma göreviyle değerlendirilir. Çok Sınıflı sınıflandırma görevinde sistemin bir video bölümünde mevcut olan şiddet sınıfını tespit etmesi gerekir. Bu, şiddetin varlığını tespit etmekten çok daha zor bir iştir ve burada sunulan sistem, bu sorunu çözen ilk sistemlerden biridir. İkili sınıflandırma görevi, sistemin şiddet sınıfını bulmaya gerek kalmadan yalnızca şiddetin varlığını tespit etmesi gereken görevdir. Bu görevde, herhangi bir şiddet sınıfı için Çoklu Sınıf sınıflandırma görevinden elde edilen nihai sınıflandırma puanı 0,5'ten fazla ise video segmenti “Şiddet”, aksi halde “Şiddet Yok” olarak kategorize edilir. Çok Sınıflı sınıflandırma görevinden elde edilen sonuçlar mükemmel olmaktan uzaktır ve iyileştirmeye yer vardır; oysa İkili sınıflandırma görevlerindeki sonuçlar, MediaEval-2014'ün mevcut kıyaslama sonuçlarından daha iyidir. Ancak bu sonuçlar kesinlikle cesaret vericidir. Bölüm 5.2'de mevcut çalışmanın genişletilebileceği olası yönlere ilişkin ayrıntılı bir tartışma sunulmaktadır.

5.2. Gelecek iş

Mevcut çalışmanın genişletilebileceği birçok olası yön vardır. Bir yön mevcut sistemin performansını iyileştirmek olacaktır. Bunun için bireysel sınıflandırıcıların performansının iyileştirilmesi gerekmektedir. Hareket ve Kan, sınıflandırıcı performansının makul düzeyde iyileştirilmesi gereken iki özelliktir. Bölüm 4.4'te açıklandığı gibi, hareket sınıflandırıcının performansını artırmak için hareket özelliklerini çıkarmak için kullanılan yaklaşımın değiştirilmesi gerekir. Blood için sorun, özellik çıkarıcıda değil, sınıflandırıcıyı eğitmek için kullanılan veri kümesindedir. Eğitim için yeterli miktarda kan içeren çerçeve içeren uygun bir veri seti kullanılmalıdır. Bu iyileştirmeleri yapmak daha iyi bir sistem kurmanın ilk adımı olmalıdır. Gelecekteki çalışmaların bir diğer yönü bu sistemi uyarlamak ve farklı uygulamalar için farklı araçlar geliştirmek olacaktır. Örneğin, (i) şiddet içeren video bölümlerini belirli bir giriş videosundan çıkarabilecek bir araç geliştirilebilir. Bu, video etiketlemede yararlı olabilir. (ii) Sistemin, içindeki şiddet içeren içerik miktarına bağlı olarak bir filmi derecelendirmek için kullanılabileceği ebeveyn kontrolü için benzer bir araç geliştirilebilir. Gelecekteki çalışmalar için olası bir başka yön, sistemin hızının, güvenlik kameralarının video akışından şiddetin gerçek zamanlı tespitinde kullanılabilmesini sağlayacak şekilde iyileştirilmesidir. Böyle bir sistemin geliştirilmesi için ihtiyaç duyulan iyileştirmeler önemsiz olmayacaktır.