লেখক:
(1) Pinelopi Papalampidi, Institute for Language, Cognition and Computation, School of Informatics, University of Edinburgh;
(2) ফ্র্যাঙ্ক কেলার, ভাষা, জ্ঞান ও গণনার ইনস্টিটিউট, স্কুল অফ ইনফরমেটিক্স, এডিনবার্গ বিশ্ববিদ্যালয়;
(৩) মিরেলা লাপাতা, ইনস্টিটিউট ফর ল্যাঙ্গুয়েজ, কগনিশন অ্যান্ড কম্পিউটেশন, স্কুল অফ ইনফরমেটিক্স, ইউনিভার্সিটি অফ এডিনবার্গ।
মুভি বোঝার পূর্ববর্তী পদ্ধতিগুলি মূলত বিচ্ছিন্ন ভিডিও ক্লিপগুলিতে ফোকাস করেছে, এবং কাজগুলি যেমন মুভির দৃশ্য এবং বইয়ের অধ্যায়গুলির মধ্যে সারিবদ্ধকরণ [49], প্রশ্নের উত্তর [50], মুভির শটগুলির জন্য ভিডিও ক্যাপশনিং [44], এবং পাঠ্য থেকে ভিডিও পুনরুদ্ধার [5]. সাম্প্রতিক কাজ [40-42] উচ্চ-স্তরের বর্ণনামূলক কাঠামো সনাক্ত করার চেষ্টা করে এবং সম্পূর্ণ টিভি এপিসোড এবং চলচ্চিত্রগুলির সংক্ষিপ্তসার করে যা একচেটিয়াভাবে টেক্সচুয়াল পদ্ধতিতে (যেমন চিত্রনাট্য) ফোকাস করে।
ট্রেলার জেনারেশনের বিদ্যমান পন্থাগুলি সুপারফিশিয়াল অডিওভিজ্যুয়াল বৈশিষ্ট্যগুলিকে কাজে লাগায়, যেমন ব্যাকগ্রাউন্ড মিউজিক বা ক্রমিক শটের মধ্যে ভিজ্যুয়াল পরিবর্তন [24, 46]। অন্যান্য কাজ শট নির্বাচনের জন্য একটি গ্রাফ-ভিত্তিক মডেল সহ "আকর্ষণীয়" ট্রেলার তৈরি করে [৫৭] অথবা অডিওভিজ্যুয়াল সেন্টিমেন্ট বিশ্লেষণের মাধ্যমে হরর মুভিতে প্রশিক্ষিত একটি মডেলের সাথে একযোগে একজন মানুষকে লুপে ব্যবহার করে [৪৭]। ট্রেলার মোমেন্ট ডিটেকশন ডেটাসেট [৫৩] পূর্ণ দৈর্ঘ্যের চলচ্চিত্রগুলি নিয়ে গঠিত যা অফিসিয়াল ট্রেলার এবং মূল মুহুর্তগুলির জন্য টীকাগুলির সাথে যুক্ত, তবে এটি সর্বজনীনভাবে উপলব্ধ নয় এবং চিত্রনাট্য অন্তর্ভুক্ত করে না।
জ্ঞান পাতন [3, 23] মূলত একটি বৃহত্তর শিক্ষক মডেল থেকে একটি ছোট ছাত্রের কাছে তথ্য পাতন করার জন্য প্রস্তাব করা হয়েছিল। সাধারণীকৃত পাতন [৩০] সুবিধাপ্রাপ্ত তথ্য ব্যবহার করার জন্য একটি কাঠামো প্রদান করে, যেমন, তথ্য যা শুধুমাত্র প্রশিক্ষণের সময় উপলব্ধ। আমাদের কাজের সাথে সর্বাধিক সম্পর্কিত হল একই বিষয়বস্তুর বিভিন্ন পদ্ধতি বা দর্শনের ব্যবহার [33, 34], যেমন, নির্দেশমূলক ভিডিওগুলিতে ভিজ্যুয়াল উপস্থাপনা শিখতে প্রতিলিপিকৃত বর্ণনা। আমরা বিশেষ সুবিধাপ্রাপ্ত তথ্যের উত্স হিসাবে চিত্রনাট্যগুলিকে ব্যবহার করি এবং একটি চলচ্চিত্রের ঘটনা, চরিত্র এবং দৃশ্য সম্পর্কে জ্ঞান লাভ করি, যা আমরা পরবর্তীতে ভিডিওতে ট্রেলারের যোগ্য শট সনাক্ত করার জন্য ব্যবহার করি।
এই কাগজটি CC BY-SA 4.0 DEED লাইসেন্সের অধীনে arxiv-এ উপলব্ধ ।