paint-brush
वीडियो में हिंसा का पता लगाना: सारद्वारा@kinetograph

वीडियो में हिंसा का पता लगाना: सार

बहुत लंबा; पढ़ने के लिए

इस शोधपत्र में शोधकर्ताओं ने वीडियो में हिंसा का स्वतः पता लगाने के लिए एक प्रणाली का प्रस्ताव दिया है, जिसमें वर्गीकरण के लिए श्रव्य और दृश्य संकेतों का उपयोग किया जाता है।
featured image - वीडियो में हिंसा का पता लगाना: सार
Kinetograph: The Video Editing Technology Publication HackerNoon profile picture
0-item


लेखक:

(1) प्रवीण तिरुपत्तूर, सेंट्रल फ्लोरिडा विश्वविद्यालय।

लिंक की तालिका

अमूर्त

हाल के वर्षों में, फेसबुक और यूट्यूब जैसी सोशल नेटवर्किंग और वीडियो शेयरिंग वेबसाइट पर अपलोड की जाने वाली वीडियो सामग्री की मात्रा में जबरदस्त वृद्धि हुई है। इसके परिणामस्वरूप, बच्चों के वेब पर वयस्क और हिंसक सामग्री के संपर्क में आने का जोखिम भी बढ़ गया है। इस समस्या को हल करने के लिए, इस कार्य में वीडियो में हिंसक सामग्री को स्वचालित रूप से पहचानने का एक तरीका प्रस्तावित किया गया है। यहाँ, वीडियो में मौजूद हिंसा की श्रेणी का पता लगाने का एक नया प्रयास भी किया गया है। एक प्रणाली जो हॉलीवुड फिल्मों और वेब से वीडियो दोनों से हिंसा का स्वचालित रूप से पता लगा सकती है, न केवल अभिभावकीय नियंत्रण में बल्कि मूवी रेटिंग, वीडियो निगरानी, शैली वर्गीकरण आदि से संबंधित अनुप्रयोगों के लिए भी बेहद उपयोगी है।


यहाँ, हिंसा का पता लगाने के लिए ऑडियो और विज़ुअल दोनों सुविधाओं का उपयोग किया जाता है। MFCC सुविधाओं का उपयोग ऑडियो संकेतों के रूप में किया जाता है। रक्त, गति और सेंटीबैंक सुविधाओं का उपयोग दृश्य संकेतों के रूप में किया जाता है। हिंसा का पता लगाने के लिए बाइनरी SVM क्लासिफायर को इनमें से प्रत्येक सुविधा पर प्रशिक्षित किया जाता है। सिस्टम द्वारा हिंसा वर्ग लक्ष्य में से प्रत्येक के लिए अंतिम वर्गीकरण स्कोर प्राप्त करने के लिए वर्गीकरण स्कोर के भारित योग का उपयोग करके लेट फ़्यूज़न किया जाता है। प्रत्येक हिंसा वर्ग के लिए इष्टतम भार निर्धारित करने के लिए ग्रिड खोज पर आधारित दृष्टिकोण का उपयोग किया जाता है। सार्वजनिक रूप से उपलब्ध डेटासेट, मुख्य रूप से हिंसक दृश्य पहचान (VSD), का उपयोग क्लासिफायर प्रशिक्षण, भार गणना और परीक्षण के लिए किया जाता है। सिस्टम के प्रदर्शन का मूल्यांकन दो वर्गीकरण कार्यों, मल्टी-क्लास वर्गीकरण और बाइनरी वर्गीकरण पर किया जाता है। बाइनरी वर्गीकरण के लिए प्राप्त परिणाम MediaEval-2014 के बेसलाइन परिणामों से बेहतर हैं।


यह पेपर CC 4.0 लाइसेंस के अंतर्गत arxiv पर उपलब्ध है।