paint-brush
VEATIC: ভিডিও-ভিত্তিক আবেগ এবং প্রসঙ্গ ডেটাসেটে ট্র্যাকিংকে প্রভাবিত করে: ভিডিও জুড়ে বিষয় চুক্তিদ্বারা@kinetograph
327 পড়া
327 পড়া

VEATIC: ভিডিও-ভিত্তিক আবেগ এবং প্রসঙ্গ ডেটাসেটে ট্র্যাকিংকে প্রভাবিত করে: ভিডিও জুড়ে বিষয় চুক্তি

অতিদীর্ঘ; পড়তে

এই গবেষণাপত্রে, গবেষকরা মানব প্রভাবিত স্বীকৃতির জন্য VEATIC ডেটাসেট প্রবর্তন করেছেন, বিদ্যমান ডেটাসেটের সীমাবদ্ধতাগুলিকে মোকাবেলা করে, প্রসঙ্গ-ভিত্তিক অনুমান সক্ষম করে৷
featured image - VEATIC: ভিডিও-ভিত্তিক আবেগ এবং প্রসঙ্গ ডেটাসেটে ট্র্যাকিংকে প্রভাবিত করে: ভিডিও জুড়ে বিষয় চুক্তি
Kinetograph: The Video Editing Technology Publication HackerNoon profile picture
0-item

এই কাগজটি CC 4.0 লাইসেন্সের অধীনে arxiv-এ উপলব্ধ।

লেখক:

(1) ঝিহাং রেন, ক্যালিফোর্নিয়া বিশ্ববিদ্যালয়, বার্কলে এবং এই লেখকরা এই কাজে সমানভাবে অবদান রেখেছেন (ইমেল: [email protected]);

(2) জেফারসন ওর্তেগা, ক্যালিফোর্নিয়া বিশ্ববিদ্যালয়, বার্কলে এবং এই লেখকরা এই কাজে সমানভাবে অবদান রেখেছেন (ইমেল: [email protected]);

(3) ইফান ওয়াং, ক্যালিফোর্নিয়া বিশ্ববিদ্যালয়, বার্কলে এবং এই লেখকরা এই কাজে সমানভাবে অবদান রেখেছেন (ইমেল: [email protected]);

(4) ঝিমিন চেন, ক্যালিফোর্নিয়া বিশ্ববিদ্যালয়, বার্কলে (ইমেল: [email protected]);

(5) Yunhui Guo, ডালাসে টেক্সাস বিশ্ববিদ্যালয় (ইমেল: [email protected]);

(6) স্টেলা এক্স ইউ, ইউনিভার্সিটি অফ ক্যালিফোর্নিয়া, বার্কলে এবং ইউনিভার্সিটি অফ মিশিগান, অ্যান আর্বার (ইমেল: [email protected]);

(7) ডেভিড হুইটনি, ক্যালিফোর্নিয়া বিশ্ববিদ্যালয়, বার্কলে (ইমেল: [email protected])।

লিঙ্কের টেবিল

10. ভিডিও জুড়ে বিষয় চুক্তি

VEATIC ডেটাসেটের একটি সুবিধা হল যে এটিতে প্রতিটি ভিডিওর জন্য একাধিক টীকা রয়েছে এবং যেকোনো ভিডিওর জন্য সর্বনিম্ন সংখ্যক 25 টি এবং সর্বাধিক 73 টি। আবেগের উপলব্ধি বিষয়ভিত্তিক এবং পর্যবেক্ষকদের রায় একাধিক ব্যক্তির মধ্যে পরিবর্তিত হতে পারে। পূর্বে প্রকাশিত অনেক ইমোশন ডেটাসেটে টীকাকারের সংখ্যা খুবই কম, প্রায়শই শুধুমাত্র একক সংখ্যা (n <10) সংখ্যক টীকা থাকে। পর্যবেক্ষকদের মধ্যে বর্ধিত বৈচিত্র্যের কারণে এত কম টীকা থাকা সমস্যাযুক্ত। এটি দেখানোর জন্য, আমরা গণনা করেছি কিভাবে আমাদের ডেটাসেটে প্রতিটি ভিডিওর গড় রেটিং পরিবর্তিত হয় যদি আমরা এলোমেলোভাবে নমুনা করে, প্রতিস্থাপন সহ, পাঁচটি বনাম সমস্ত টীকাকার। আমরা প্রতিটি ভিডিওর জন্য এই প্রক্রিয়াটি 1000 বার পুনরাবৃত্তি করেছি এবং পুনঃগণনা করা গড় রেটিংয়ের মানক বিচ্যুতি গণনা করেছি। চিত্র 12a দেখায় কিভাবে ভিডিও জুড়ে সম্মতি রেটিংয়ের মানক বিচ্যুতি পরিবর্তিত হয় যদি আমরা প্রতিটি ভিডিওর জন্য পাঁচটি বা সমস্ত টীকা ব্যবহার করি। এই বিশ্লেষণটি দেখায় যে আরও বেশি টীকা থাকার ফলে ঐকমত্য রেটিংয়ে অনেক ছোট স্ট্যান্ডার্ড বিচ্যুতি ঘটে যা ভিডিওগুলিতে গ্রাউন্ড ট্রুথ ইমোশনের আরও সঠিক উপস্থাপনা করতে পারে।


চিত্র 9. VEATIC-এ আরও নমুনা ভিডিও ফ্রেম। VEATIC-এর ভিডিও ক্লিপগুলিতে বিভিন্ন ব্যাকগ্রাউন্ড, আলোর অবস্থা, চরিত্রের মিথস্ক্রিয়া ইত্যাদি রয়েছে, যা এটিকে শুধুমাত্র আবেগ শনাক্তকরণের কাজই নয়, অন্যান্য ভিডিও বোঝার কাজগুলির জন্যও একটি ব্যাপক ডেটাসেট তৈরি করে।


চিত্র 10. VEATIC-এ অনির্বাচিত অক্ষর এবং বিশুদ্ধ পটভূমির নমুনা ভিডিও ফ্রেম। প্রতিটি সারির প্রথম নমুনা ফ্রেম নির্বাচিত অক্ষর দেখায়। বাকি নমুনা ফ্রেমগুলি হয় অনির্বাচিত অক্ষর বা বিশুদ্ধ পটভূমি।


উপরন্তু, আমরা প্রতিটি ভিডিওর জন্য পর্যবেক্ষক জুড়ে মানক বিচ্যুতি গণনা করে ভিডিও জুড়ে পর্যবেক্ষকদের প্রতিক্রিয়াগুলি কীভাবে পরিবর্তিত হয়েছে তা তদন্ত করেছি। চিত্র 12b ভিডিও জুড়ে আদর্শ বিচ্যুতি দেখায়। আমরা দেখতে পাই যে ভ্যালেন্স এবং উত্তেজনা উভয় মাত্রার মানক বিচ্যুতি ছোট ছিল যেখানে ভ্যালেন্সের গড় প্রমিত বিচ্যুতি µ = 0.248 এবং একটি মধ্যক 0.222 এবং উত্তেজনার গড় মান বিচ্যুতি µ = 0.248 এবং 0.244 এর মধ্যম, যা তুলনাযোগ্য। ইমোটিক [৩২] থেকে ভ্যালেন্স এবং উত্তেজনা রেটিং বৈচিত্র সহ।


এই কাগজটি CC 4.0 লাইসেন্সের অধীনে arxiv-এ উপলব্ধ


L O A D I N G
. . . comments & more!

About Author

Kinetograph: The Video Editing Technology Publication HackerNoon profile picture
Kinetograph: The Video Editing Technology Publication@kinetograph
The Kinetograph's the 1st motion-picture camera. At Kinetograph.Tech, we cover cutting edge tech for video editing.

আসে ট্যাগ

এই নিবন্ধটি উপস্থাপন করা হয়েছে...