paint-brush
ভিডিওতে সহিংসতা সনাক্তকরণ: বিমূর্তদ্বারা@kinetograph

ভিডিওতে সহিংসতা সনাক্তকরণ: বিমূর্ত

অতিদীর্ঘ; পড়তে

এই কাগজে, গবেষকরা ভিডিওতে সহিংসতার স্বয়ংক্রিয় সনাক্তকরণের জন্য একটি সিস্টেমের প্রস্তাব করেছেন, শ্রেণিবিন্যাসের জন্য অডিও এবং ভিজ্যুয়াল সংকেত ব্যবহার করে।
featured image - ভিডিওতে সহিংসতা সনাক্তকরণ: বিমূর্ত
Kinetograph: The Video Editing Technology Publication HackerNoon profile picture
0-item


লেখক:

(1) প্রবীণ তিরুপত্তুর, সেন্ট্রাল ফ্লোরিডা বিশ্ববিদ্যালয়।

লিঙ্কের টেবিল

বিমূর্ত

সাম্প্রতিক বছরগুলিতে, ফেসবুক এবং ইউটিউবের মতো সোশ্যাল নেটওয়ার্কিং এবং ভিডিও শেয়ারিং ওয়েবসাইটগুলিতে আপলোড করা ভিডিও সামগ্রীর পরিমাণে অসাধারণ বৃদ্ধি ঘটেছে। এর ফলে, ওয়েবে প্রাপ্তবয়স্কদের এবং হিংসাত্মক বিষয়বস্তুতে শিশুদের সংস্পর্শে আসার ঝুঁকিও বেড়ে যায়। এই সমস্যাটি সমাধান করার জন্য, ভিডিওগুলিতে স্বয়ংক্রিয়ভাবে হিংসাত্মক বিষয়বস্তু সনাক্ত করার একটি পদ্ধতি এই কাজে প্রস্তাব করা হয়েছে। এখানে, একটি ভিডিওতে উপস্থিত সহিংসতার বিভাগ সনাক্ত করার একটি অভিনব প্রচেষ্টাও করা হয়েছে। একটি সিস্টেম যা হলিউডের সিনেমা এবং ওয়েব থেকে ভিডিও উভয় থেকে স্বয়ংক্রিয়ভাবে সহিংসতা সনাক্ত করতে পারে তা শুধুমাত্র পিতামাতার নিয়ন্ত্রণেই নয়, সিনেমার রেটিং, ভিডিও নজরদারি, জেনার শ্রেণীবিভাগ ইত্যাদি সম্পর্কিত অ্যাপ্লিকেশনগুলির জন্যও অত্যন্ত কার্যকর।


এখানে, অডিও এবং ভিজ্যুয়াল উভয় বৈশিষ্ট্যই সহিংসতা সনাক্ত করতে ব্যবহৃত হয়। MFCC বৈশিষ্ট্যগুলি অডিও সংকেত হিসাবে ব্যবহৃত হয়। রক্ত, গতি, এবং SentiBank বৈশিষ্ট্যগুলি চাক্ষুষ সংকেত হিসাবে ব্যবহৃত হয়। বাইনারি SVM ক্লাসিফায়ারদের সহিংসতা সনাক্ত করতে এই বৈশিষ্ট্যগুলির প্রতিটিতে প্রশিক্ষণ দেওয়া হয়। শ্রেণীবিন্যাস স্কোরের একটি ওজনযুক্ত সমষ্টি ব্যবহার করে দেরী ফিউশন সিস্টেমের দ্বারা প্রতিটি সহিংস শ্রেণীর লক্ষ্যের জন্য চূড়ান্ত শ্রেণীবিভাগ স্কোর পেতে সঞ্চালিত হয়। সহিংসতার প্রতিটি শ্রেণীর জন্য সর্বোত্তম ওজন নির্ধারণ করতে গ্রিড অনুসন্ধানের উপর ভিত্তি করে একটি পদ্ধতি ব্যবহার করা হয়। সর্বজনীনভাবে উপলব্ধ ডেটাসেট, প্রধানত ভায়োলেন্ট সিন ডিটেকশন (VSD), ক্লাসিফায়ার প্রশিক্ষণ, ওজন গণনা এবং পরীক্ষার জন্য ব্যবহৃত হয়। সিস্টেমের কর্মক্ষমতা দুটি শ্রেণীবিভাগের কাজ, মাল্টি-ক্লাস শ্রেণীবিভাগ, এবং বাইনারি শ্রেণীবিভাগের উপর মূল্যায়ন করা হয়। বাইনারি শ্রেণীবিভাগের জন্য প্রাপ্ত ফলাফল MediaEval-2014 থেকে বেসলাইন ফলাফলের চেয়ে ভালো।


এই কাগজটি CC 4.0 লাইসেন্সের অধীনে arxiv-এ উপলব্ধ