लेखक:
(1) प्रवीण तिरुपत्तूर, सेंट्रल फ्लोरिडा विश्वविद्यालय।
हाल के वर्षों में, फेसबुक और यूट्यूब जैसी सोशल नेटवर्किंग और वीडियो शेयरिंग वेबसाइट पर अपलोड की जाने वाली वीडियो सामग्री की मात्रा में जबरदस्त वृद्धि हुई है। इसके परिणामस्वरूप, बच्चों के वेब पर वयस्क और हिंसक सामग्री के संपर्क में आने का जोखिम भी बढ़ गया है। इस समस्या को हल करने के लिए, इस कार्य में वीडियो में हिंसक सामग्री को स्वचालित रूप से पहचानने का एक तरीका प्रस्तावित किया गया है। यहाँ, वीडियो में मौजूद हिंसा की श्रेणी का पता लगाने का एक नया प्रयास भी किया गया है। एक प्रणाली जो हॉलीवुड फिल्मों और वेब से वीडियो दोनों से हिंसा का स्वचालित रूप से पता लगा सकती है, न केवल अभिभावकीय नियंत्रण में बल्कि मूवी रेटिंग, वीडियो निगरानी, शैली वर्गीकरण आदि से संबंधित अनुप्रयोगों के लिए भी बेहद उपयोगी है।
यहाँ, हिंसा का पता लगाने के लिए ऑडियो और विज़ुअल दोनों सुविधाओं का उपयोग किया जाता है। MFCC सुविधाओं का उपयोग ऑडियो संकेतों के रूप में किया जाता है। रक्त, गति और सेंटीबैंक सुविधाओं का उपयोग दृश्य संकेतों के रूप में किया जाता है। हिंसा का पता लगाने के लिए बाइनरी SVM क्लासिफायर को इनमें से प्रत्येक सुविधा पर प्रशिक्षित किया जाता है। सिस्टम द्वारा हिंसा वर्ग लक्ष्य में से प्रत्येक के लिए अंतिम वर्गीकरण स्कोर प्राप्त करने के लिए वर्गीकरण स्कोर के भारित योग का उपयोग करके लेट फ़्यूज़न किया जाता है। प्रत्येक हिंसा वर्ग के लिए इष्टतम भार निर्धारित करने के लिए ग्रिड खोज पर आधारित दृष्टिकोण का उपयोग किया जाता है। सार्वजनिक रूप से उपलब्ध डेटासेट, मुख्य रूप से हिंसक दृश्य पहचान (VSD), का उपयोग क्लासिफायर प्रशिक्षण, भार गणना और परीक्षण के लिए किया जाता है। सिस्टम के प्रदर्शन का मूल्यांकन दो वर्गीकरण कार्यों, मल्टी-क्लास वर्गीकरण और बाइनरी वर्गीकरण पर किया जाता है। बाइनरी वर्गीकरण के लिए प्राप्त परिणाम MediaEval-2014 के बेसलाइन परिणामों से बेहतर हैं।
यह पेपर CC 4.0 लाइसेंस के अंतर्गत arxiv पर उपलब्ध है।