paint-brush
টাস্ক ডিকম্পোজিশনের মাধ্যমে ফিল্ম ট্রেলার জেনারেশন: অ্যাবস্ট্রাক্ট এবং ইন্ট্রোদ্বারা@kinetograph
150 পড়া

টাস্ক ডিকম্পোজিশনের মাধ্যমে ফিল্ম ট্রেলার জেনারেশন: অ্যাবস্ট্রাক্ট এবং ইন্ট্রো

অতিদীর্ঘ; পড়তে

এই গবেষণাপত্রে, গবেষকরা ট্রেলার তৈরি করার জন্য গ্রাফ হিসাবে চলচ্চিত্রগুলিকে মডেল করেন, আখ্যানের কাঠামো সনাক্ত করে এবং অনুভূতির পূর্বাভাস দেয়, তত্ত্বাবধানে থাকা পদ্ধতিগুলিকে ছাড়িয়ে যায়।
featured image - টাস্ক ডিকম্পোজিশনের মাধ্যমে ফিল্ম ট্রেলার জেনারেশন: অ্যাবস্ট্রাক্ট এবং ইন্ট্রো
Kinetograph: The Video Editing Technology Publication HackerNoon profile picture
0-item

লেখক:

(1) Pinelopi Papalampidi, Institute for Language, Cognition and Computation, School of Informatics, University of Edinburgh;

(2) ফ্র্যাঙ্ক কেলার, ভাষা, জ্ঞান ও গণনার ইনস্টিটিউট, স্কুল অফ ইনফরমেটিক্স, এডিনবার্গ বিশ্ববিদ্যালয়;

(৩) মিরেলা লাপাতা, ইনস্টিটিউট ফর ল্যাঙ্গুয়েজ, কগনিশন অ্যান্ড কম্পিউটেশন, স্কুল অফ ইনফরমেটিক্স, ইউনিভার্সিটি অফ এডিনবার্গ।

লিঙ্কের টেবিল

বিমূর্ত

সিনেমার ট্রেলারগুলি একাধিক কার্য সম্পাদন করে: তারা দর্শকদের গল্পের সাথে পরিচয় করিয়ে দেয়, চলচ্চিত্রের মেজাজ এবং শৈল্পিক শৈলীকে বোঝায় এবং দর্শকদের সিনেমাটি দেখতে উত্সাহিত করে। এই বৈচিত্র্যপূর্ণ ফাংশনগুলি স্বয়ংক্রিয় ট্রেলার প্রজন্মকে একটি চ্যালেঞ্জিং প্রচেষ্টা করে তোলে। আমরা এটিকে দুটি সাবটাস্কে বিভক্ত করি: বর্ণনামূলক কাঠামো সনাক্তকরণ এবং অনুভূতির পূর্বাভাস। আমরা গ্রাফ হিসাবে চলচ্চিত্রগুলিকে মডেল করি, যেখানে নোডগুলি শট এবং প্রান্তগুলি তাদের মধ্যে শব্দার্থিক সম্পর্ককে নির্দেশ করে। আমরা যৌথ বৈপরীত্যমূলক প্রশিক্ষণ ব্যবহার করে এই সম্পর্কগুলি শিখি যা চিত্রনাট্য থেকে সুবিধাপ্রাপ্ত পাঠ্য তথ্য (যেমন, চরিত্র, ক্রিয়া, পরিস্থিতি) ব্যবহার করে। একটি তত্ত্বাবধানহীন অ্যালগরিদম তারপর গ্রাফটি অতিক্রম করে এবং এমন ট্রেলার তৈরি করে যা মানব বিচারকরা প্রতিযোগিতামূলক তত্ত্বাবধানের পদ্ধতির দ্বারা উত্পন্ন হওয়াকে পছন্দ করেন।

1। পরিচিতি

ট্রেলার হল ছোট ভিডিও যা সিনেমার প্রচারের জন্য ব্যবহৃত হয় এবং প্রায়ই বাণিজ্যিক সাফল্যের জন্য গুরুত্বপূর্ণ। যদিও তাদের মূল কাজ হল ফিল্মটিকে বিভিন্ন শ্রোতার কাছে বিপণন করা, ট্রেলারগুলি হল প্ররোচনামূলক শিল্প এবং প্রচারমূলক আখ্যানের একটি রূপ, যা দর্শকদের সিনেমাটি দেখতে আগ্রহী করে তোলার জন্য ডিজাইন করা হয়েছে। যদিও ট্রেলার তৈরিকে একটি শৈল্পিক প্রচেষ্টা হিসাবে বিবেচনা করা হয়, ফিল্ম ইন্ডাস্ট্রি ট্রেলার নির্মাণের দিকনির্দেশনামূলক কৌশলগুলি তৈরি করেছে। চিন্তাধারার একটি স্কুলের মতে, ট্রেলারগুলিকে অবশ্যই একটি বর্ণনামূলক কাঠামো প্রদর্শন করতে হবে, যার মধ্যে তিনটি কাজ রয়েছে[1]। প্রথম কাজটি গল্পের চরিত্র এবং সেটআপ স্থাপন করে, দ্বিতীয় কাজটি মূল দ্বন্দ্বের পরিচয় দেয় এবং তৃতীয় কাজটি দাগ তুলে দেয় এবং শেষ থেকে টিজার সরবরাহ করে। গল্পের উত্থান-পতন দ্বারা সংজ্ঞায়িত ট্রেলারের মেজাজের সাথে আরও একটি চিন্তাভাবনা বেশি উদ্বিগ্ন। এই পদ্ধতি অনুসারে, দর্শকদের বিমোহিত করার জন্য প্রথমে ট্রেলারগুলির মাঝারি তীব্রতা থাকা উচিত, তারপরে গল্প সম্পর্কে মূল তথ্য প্রদানের জন্য কম তীব্রতা থাকা উচিত এবং তারপর ট্রেলারের শেষে একটি ক্লাইম্যাক্সে পৌঁছানো পর্যন্ত ধীরে ধীরে তীব্রতা বৃদ্ধি করা উচিত।


চিত্র 1. টার্নিং পয়েন্ট এবং তাদের সংজ্ঞা।


স্বয়ংক্রিয়ভাবে ট্রেলার তৈরি করতে, আমাদের নিম্ন স্তরের কাজগুলি যেমন ব্যক্তি সনাক্তকরণ, ক্রিয়া শনাক্তকরণ এবং অনুভূতির ভবিষ্যদ্বাণী করতে হবে, তবে আরও উচ্চ-স্তরের কাজগুলি যেমন ঘটনা এবং তাদের কার্যকারণগুলির মধ্যে সংযোগ বোঝার পাশাপাশি চরিত্রগুলি এবং তাদের সম্পর্কে অনুমান অঙ্কন করতে হবে। কর্ম কাজের জটিলতার পরিপ্রেক্ষিতে, সিনেমা-ট্রেলার জোড়া থেকে এই সমস্ত জ্ঞান সরাসরি শেখার জন্য হাজার হাজার উদাহরণের প্রয়োজন হবে, যার প্রক্রিয়াকরণ এবং টীকা একটি চ্যালেঞ্জ হবে। এইভাবে এটি আশ্চর্যজনক নয় যে স্বয়ংক্রিয় ট্রেলার জেনারেশনের পূর্ববর্তী পদ্ধতিগুলি শুধুমাত্র অডিওভিজ্যুয়াল বৈশিষ্ট্যগুলির উপর দৃষ্টি নিবদ্ধ করেছে।


মানব সম্পাদকদের সৃজনশীল প্রক্রিয়া দ্বারা অনুপ্রাণিত হয়ে, আমরা ট্রেলার জেনারেশনের জন্য একটি বটম-আপ পদ্ধতি অবলম্বন করি, যা আমরা দুটি অর্থোগোনাল, সহজ এবং সু-সংজ্ঞায়িত সাবটাস্কে বিভক্ত করি। প্রথমটি হল ন্যারেটিভ স্ট্রাকচারের আইডেন্টিফিকেশন, অর্থাৎ সিনেমার সবচেয়ে গুরুত্বপূর্ণ ঘটনা পুনরুদ্ধার করা। চিত্রনাট্য লেখায় একটি সাধারণত গৃহীত তত্ত্ব [13,22,51] পরামর্শ দেয় যে একটি সিনেমার প্লটে পাঁচ ধরনের মূল ঘটনা রয়েছে, যা টার্নিং পয়েন্ট হিসাবে পরিচিত (TPs; চিত্র 1-এ তাদের সংজ্ঞা দেখুন)। দ্বিতীয় সাবটাস্ক হল সেন্টিমেন্ট ভবিষ্যদ্বাণী, যাকে আমরা শট এবং উদ্ভূত আবেগের মধ্যে তীব্রতার প্রবাহের অনুমান হিসাবে দেখি।


আমরা একটি তত্ত্বাবধানহীন গ্রাফ-ভিত্তিক পদ্ধতি অনুসরণ করে প্রস্তাব ট্রেলার তৈরি করি। আমরা মুভিগুলিকে গ্রাফ হিসাবে মডেল করি যার নোডগুলি শট এবং যার প্রান্তগুলি শটের মধ্যে গুরুত্বপূর্ণ শব্দার্থিক সংযোগ নির্দেশ করে (চিত্র 2 দেখুন)। উপরন্তু, নোডগুলি মূল ইভেন্ট (যেমন, টিপি) এবং স্কোর সংকেত অনুভূতির তীব্রতা (ইতিবাচক বা নেতিবাচক) কিনা তা নির্দেশ করে লেবেল বহন করে। আমাদের অ্যালগরিদম ট্রেলার সিকোয়েন্স তৈরি করতে এই মুভি গ্রাফকে অতিক্রম করে। এগুলি একজন মানব সম্পাদক দ্বারা পর্যালোচনা এবং সংশোধন করার প্রস্তাব হিসাবে ব্যবহার করা যেতে পারে।


TP শনাক্তকরণ এবং অনুভূতির ভবিষ্যদ্বাণী উভয় কাজই চলচ্চিত্রের বিষয়বস্তু সম্পর্কে নিম্ন-স্তরের উপলব্ধি থেকে উপকৃত হয়। প্রকৃতপক্ষে, আমরা অক্ষর এবং স্থান সনাক্তকরণ, ক্রিয়া সনাক্তকরণ এবং শব্দার্থিক ইউনিট স্থানীয়করণের জন্য অফ-দ্য-শেল্ফ মডিউল নিয়োগ করতে পারি। যাইহোক, এই ধরনের পদ্ধতিগুলি প্রশিক্ষণ এবং অনুমানের সময় প্রাক-প্রক্রিয়াকরণের সময় এবং মেমরির প্রয়োজনীয়তাকে উল্লেখযোগ্যভাবে বৃদ্ধি করে এবং ত্রুটি প্রচারে ভোগে। পরিবর্তে, আমরা একটি বৈপরীত্যমূলক শিক্ষা ব্যবস্থার প্রস্তাব করি, যেখানে আমরা চিত্রনাট্যগুলিকে বিশেষ সুবিধাপ্রাপ্ত তথ্য হিসাবে ব্যবহার করি, অর্থাত্ শুধুমাত্র প্রশিক্ষণের সময় উপলব্ধ তথ্য। চিত্রনাট্যগুলি প্রকাশ করে যে কীভাবে সিনেমাটি দৃশ্যগুলিতে বিভক্ত করা হয়েছে, চরিত্রগুলি কারা, কখন এবং কার সাথে তারা কথা বলছে, তারা কোথায় এবং তারা কী করছে (অর্থাৎ, "দৃশ্যের শিরোনাম" ব্যাখ্যা করে যেখানে অ্যাকশনটি ঘটে যখন "অ্যাকশন লাইন" বর্ণনা করে ক্যামেরা যা দেখে)। বিশেষত, আমরা দুটি পৃথক নেটওয়ার্ক তৈরি করি, একটি টেক্সচুয়াল নেটওয়ার্ক চিত্রনাট্যের উপর ভিত্তি করে এবং একটি ভিডিওর উপর ভিত্তি করে একটি মাল্টিমোডাল, এবং অক্জিলিয়ারী কনট্রাস্টিভ লস ব্যবহার করে যৌথভাবে তাদের প্রশিক্ষণ দিই। টেক্সচুয়াল নেটওয়ার্ক অতিরিক্তভাবে সংশ্লিষ্ট সিনেমা সংগ্রহ ও প্রক্রিয়া না করেই স্ব-তত্ত্বাবধানে শিক্ষার মাধ্যমে চিত্রনাট্যের বড় সংগ্রহে প্রশিক্ষিত হতে পারে। পরীক্ষামূলক ফলাফলগুলি দেখায় যে এই বৈপরীত্যমূলক প্রশিক্ষণ পদ্ধতিটি উপকারী, যার ফলে ট্রেলারগুলি তাদের বিষয়বস্তু এবং আকর্ষণীয়তার পরিপ্রেক্ষিতে মানুষের দ্বারা অনুকূলভাবে বিচার করা হয়।


এই কাগজটি CC BY-SA 4.0 DEED লাইসেন্সের অধীনে arxiv-এ উপলব্ধ


[1] https://www.studiobinder.com/blog/how-to-make-a-movie-trailer


[2] https://www.derek-lieu.com/blog/2017/9/10/the-matrix-is-a-trailereditors-dream