paint-brush
VEATIC: ভিডিও-ভিত্তিক আবেগ এবং প্রসঙ্গ ডেটাসেটে ট্র্যাকিংকে প্রভাবিত করে: ভিডিও জুড়ে বিষয় চুক্তিদ্বারা@kinetograph
328 পড়া
328 পড়া

VEATIC: ভিডিও-ভিত্তিক আবেগ এবং প্রসঙ্গ ডেটাসেটে ট্র্যাকিংকে প্রভাবিত করে: ভিডিও জুড়ে বিষয় চুক্তি

অতিদীর্ঘ; পড়তে

এই গবেষণাপত্রে, গবেষকরা মানব প্রভাবিত স্বীকৃতির জন্য VEATIC ডেটাসেট প্রবর্তন করেছেন, বিদ্যমান ডেটাসেটের সীমাবদ্ধতাগুলিকে মোকাবেলা করে, প্রসঙ্গ-ভিত্তিক অনুমান সক্ষম করে৷
featured image - VEATIC: ভিডিও-ভিত্তিক আবেগ এবং প্রসঙ্গ ডেটাসেটে ট্র্যাকিংকে প্রভাবিত করে: ভিডিও জুড়ে বিষয় চুক্তি
Kinetograph: The Video Editing Technology Publication HackerNoon profile picture
0-item

এই কাগজটি CC 4.0 লাইসেন্সের অধীনে arxiv-এ উপলব্ধ।

লেখক:

(1) ঝিহাং রেন, ক্যালিফোর্নিয়া বিশ্ববিদ্যালয়, বার্কলে এবং এই লেখকরা এই কাজে সমানভাবে অবদান রেখেছেন (ইমেল: [email protected]);

(2) জেফারসন ওর্তেগা, ক্যালিফোর্নিয়া বিশ্ববিদ্যালয়, বার্কলে এবং এই লেখকরা এই কাজে সমানভাবে অবদান রেখেছেন (ইমেল: [email protected]);

(3) ইফান ওয়াং, ক্যালিফোর্নিয়া বিশ্ববিদ্যালয়, বার্কলে এবং এই লেখকরা এই কাজে সমানভাবে অবদান রেখেছেন (ইমেল: [email protected]);

(4) ঝিমিন চেন, ক্যালিফোর্নিয়া বিশ্ববিদ্যালয়, বার্কলে (ইমেল: [email protected]);

(5) Yunhui Guo, ডালাসে টেক্সাস বিশ্ববিদ্যালয় (ইমেল: [email protected]);

(6) স্টেলা এক্স ইউ, ইউনিভার্সিটি অফ ক্যালিফোর্নিয়া, বার্কলে এবং ইউনিভার্সিটি অফ মিশিগান, অ্যান আর্বার (ইমেল: [email protected]);

(7) ডেভিড হুইটনি, ক্যালিফোর্নিয়া বিশ্ববিদ্যালয়, বার্কলে (ইমেল: [email protected])।

লিঙ্কের টেবিল

10. ভিডিও জুড়ে বিষয় চুক্তি

VEATIC ডেটাসেটের একটি সুবিধা হল যে এটিতে প্রতিটি ভিডিওর জন্য একাধিক টীকা রয়েছে এবং যেকোনো ভিডিওর জন্য সর্বনিম্ন সংখ্যক 25 টি এবং সর্বাধিক 73 টি। আবেগের উপলব্ধি বিষয়ভিত্তিক এবং পর্যবেক্ষকদের রায় একাধিক ব্যক্তির মধ্যে পরিবর্তিত হতে পারে। পূর্বে প্রকাশিত অনেক ইমোশন ডেটাসেটে টীকাকারের সংখ্যা খুবই কম, প্রায়শই শুধুমাত্র একক সংখ্যা (n <10) সংখ্যক টীকা থাকে। পর্যবেক্ষকদের মধ্যে বর্ধিত বৈচিত্র্যের কারণে এত কম টীকা থাকা সমস্যাযুক্ত। এটি দেখানোর জন্য, আমরা গণনা করেছি কিভাবে আমাদের ডেটাসেটে প্রতিটি ভিডিওর গড় রেটিং পরিবর্তিত হয় যদি আমরা এলোমেলোভাবে নমুনা করে, প্রতিস্থাপন সহ, পাঁচটি বনাম সমস্ত টীকাকার। আমরা প্রতিটি ভিডিওর জন্য এই প্রক্রিয়াটি 1000 বার পুনরাবৃত্তি করেছি এবং পুনঃগণনা করা গড় রেটিংয়ের মানক বিচ্যুতি গণনা করেছি। চিত্র 12a দেখায় কিভাবে ভিডিও জুড়ে সম্মতি রেটিংয়ের মানক বিচ্যুতি পরিবর্তিত হয় যদি আমরা প্রতিটি ভিডিওর জন্য পাঁচটি বা সমস্ত টীকা ব্যবহার করি। এই বিশ্লেষণটি দেখায় যে আরও বেশি টীকা থাকার ফলে ঐকমত্য রেটিংয়ে অনেক ছোট স্ট্যান্ডার্ড বিচ্যুতি ঘটে যা ভিডিওগুলিতে গ্রাউন্ড ট্রুথ ইমোশনের আরও সঠিক উপস্থাপনা করতে পারে।


চিত্র 9. VEATIC-এ আরও নমুনা ভিডিও ফ্রেম। VEATIC-এর ভিডিও ক্লিপগুলিতে বিভিন্ন ব্যাকগ্রাউন্ড, আলোর অবস্থা, চরিত্রের মিথস্ক্রিয়া ইত্যাদি রয়েছে, যা এটিকে শুধুমাত্র আবেগ শনাক্তকরণের কাজই নয়, অন্যান্য ভিডিও বোঝার কাজগুলির জন্যও একটি ব্যাপক ডেটাসেট তৈরি করে।


চিত্র 10. VEATIC-এ অনির্বাচিত অক্ষর এবং বিশুদ্ধ পটভূমির নমুনা ভিডিও ফ্রেম। প্রতিটি সারির প্রথম নমুনা ফ্রেম নির্বাচিত অক্ষর দেখায়। বাকি নমুনা ফ্রেমগুলি হয় অনির্বাচিত অক্ষর বা বিশুদ্ধ পটভূমি।


উপরন্তু, আমরা প্রতিটি ভিডিওর জন্য পর্যবেক্ষক জুড়ে মানক বিচ্যুতি গণনা করে ভিডিও জুড়ে পর্যবেক্ষকদের প্রতিক্রিয়াগুলি কীভাবে পরিবর্তিত হয়েছে তা তদন্ত করেছি। চিত্র 12b ভিডিও জুড়ে আদর্শ বিচ্যুতি দেখায়। আমরা দেখতে পাই যে ভ্যালেন্স এবং উত্তেজনা উভয় মাত্রার মানক বিচ্যুতি ছোট ছিল যেখানে ভ্যালেন্সের গড় প্রমিত বিচ্যুতি µ = 0.248 এবং একটি মধ্যক 0.222 এবং উত্তেজনার গড় মান বিচ্যুতি µ = 0.248 এবং 0.244 এর মধ্যম, যা তুলনাযোগ্য। ইমোটিক [৩২] থেকে ভ্যালেন্স এবং উত্তেজনা রেটিং বৈচিত্র সহ।


এই কাগজটি CC 4.0 লাইসেন্সের অধীনে arxiv-এ উপলব্ধ