paint-brush
टास्क डिकंपोज़िशन के माध्यम से फ़िल्म ट्रेलर तैयार करना: सार और परिचयद्वारा@kinetograph
150 रीडिंग

टास्क डिकंपोज़िशन के माध्यम से फ़िल्म ट्रेलर तैयार करना: सार और परिचय

बहुत लंबा; पढ़ने के लिए

इस शोधपत्र में, शोधकर्ताओं ने ट्रेलर बनाने के लिए फिल्मों को ग्राफ के रूप में मॉडल किया, कथा संरचना की पहचान की और भावनाओं की भविष्यवाणी की, जो पर्यवेक्षित तरीकों से बेहतर है।
featured image - टास्क डिकंपोज़िशन के माध्यम से फ़िल्म ट्रेलर तैयार करना: सार और परिचय
Kinetograph: The Video Editing Technology Publication HackerNoon profile picture
0-item

लेखक:

(1) पिनेलोपी पापालाम्पीडी, भाषा, अनुभूति और संगणन संस्थान, सूचना विज्ञान स्कूल, एडिनबर्ग विश्वविद्यालय;

(2) फ्रैंक केलर, भाषा, अनुभूति और संगणन संस्थान, सूचना विज्ञान स्कूल, एडिनबर्ग विश्वविद्यालय;

(3) मिरेला लापाटा, भाषा, अनुभूति और संगणन संस्थान, सूचना विज्ञान स्कूल, एडिनबर्ग विश्वविद्यालय।

लिंक की तालिका

अमूर्त

मूवी ट्रेलर कई कार्य करते हैं: वे दर्शकों को कहानी से परिचित कराते हैं, फिल्म के मूड और कलात्मक शैली को व्यक्त करते हैं, और दर्शकों को फिल्म देखने के लिए प्रोत्साहित करते हैं। ये विविध कार्य स्वचालित ट्रेलर निर्माण को एक चुनौतीपूर्ण प्रयास बनाते हैं। हम इसे दो उप-कार्यों में विभाजित करते हैं: कथा संरचना पहचान और भावना भविष्यवाणी। हम फिल्मों को ग्राफ़ के रूप में मॉडल करते हैं, जहाँ नोड्स शॉट होते हैं और किनारे उनके बीच अर्थ संबंधों को दर्शाते हैं। हम इन संबंधों को संयुक्त विपरीत प्रशिक्षण का उपयोग करके सीखते हैं जो पटकथाओं से विशेषाधिकार प्राप्त पाठ्य सूचना (जैसे, पात्र, क्रियाएँ, परिस्थितियाँ) का लाभ उठाता है। एक अप्रशिक्षित एल्गोरिथ्म फिर ग्राफ़ को पार करता है और ऐसे ट्रेलर बनाता है जिन्हें मानव न्यायाधीश प्रतिस्पर्धी पर्यवेक्षित दृष्टिकोणों द्वारा बनाए गए ट्रेलरों से अधिक पसंद करते हैं।

1 परिचय

ट्रेलर फिल्मों को बढ़ावा देने के लिए इस्तेमाल किए जाने वाले छोटे वीडियो होते हैं और अक्सर व्यावसायिक सफलता के लिए महत्वपूर्ण होते हैं। जबकि उनका मुख्य कार्य दर्शकों की एक श्रृंखला के लिए फिल्म का विपणन करना है, ट्रेलर प्रेरक कला और प्रचार कथा का एक रूप भी हैं, जो दर्शकों को फिल्म देखने के लिए प्रेरित करने के लिए डिज़ाइन किए गए हैं। भले ही ट्रेलरों का निर्माण एक कलात्मक प्रयास माना जाता है, लेकिन फिल्म उद्योग ने ट्रेलर निर्माण को निर्देशित करने वाली रणनीतियाँ विकसित की हैं। एक विचारधारा के अनुसार, ट्रेलरों में एक कथात्मक संरचना प्रदर्शित होनी चाहिए, जिसमें तीन अधिनियम शामिल हों[1]। पहला अधिनियम कहानी के पात्रों और सेटअप को स्थापित करता है, दूसरा अधिनियम मुख्य संघर्ष का परिचय देता है, और तीसरा अधिनियम दांव बढ़ाता है और अंत से टीज़र प्रदान करता है। एक अन्य विचारधारा ट्रेलर के मूड से अधिक चिंतित है जैसा कि कहानी के उतार-चढ़ाव द्वारा परिभाषित किया गया है[2]। इस दृष्टिकोण के अनुसार, दर्शकों को लुभाने के लिए ट्रेलरों में पहले मध्यम तीव्रता होनी चाहिए, उसके बाद कहानी के बारे में महत्वपूर्ण जानकारी देने के लिए कम तीव्रता होनी चाहिए, और फिर ट्रेलर के अंत में चरमोत्कर्ष तक पहुँचने तक उत्तरोत्तर तीव्रता बढ़ानी चाहिए।


चित्र 1. महत्वपूर्ण मोड़ और उनकी परिभाषाएँ।


ट्रेलरों को स्वचालित रूप से बनाने के लिए, हमें व्यक्ति की पहचान, क्रिया पहचान और भावना की भविष्यवाणी जैसे निम्न-स्तरीय कार्य करने की आवश्यकता होती है, लेकिन साथ ही अधिक उच्च-स्तरीय कार्य जैसे कि घटनाओं और उनके कारण के बीच संबंधों को समझना, साथ ही पात्रों और उनके कार्यों के बारे में निष्कर्ष निकालना। कार्य की जटिलता को देखते हुए, मूवी-ट्रेलर जोड़ों से सीधे यह सारा ज्ञान सीखने के लिए कई हज़ार उदाहरणों की आवश्यकता होगी, जिनकी प्रोसेसिंग और एनोटेशन एक चुनौती होगी। इसलिए यह आश्चर्य की बात नहीं है कि स्वचालित ट्रेलर निर्माण के पिछले तरीकों [24,46,53] ने केवल दृश्य-श्रव्य सुविधाओं पर ध्यान केंद्रित किया है।


मानव संपादकों की रचनात्मक प्रक्रिया से प्रेरित होकर, हम ट्रेलर निर्माण के लिए नीचे से ऊपर की ओर दृष्टिकोण अपनाते हैं, जिसे हम दो ऑर्थोगोनल, सरल और अच्छी तरह से परिभाषित उप-कार्यों में विभाजित करते हैं। पहला है कथा संरचना की पहचान, यानी, फिल्म की सबसे महत्वपूर्ण घटनाओं को पुनः प्राप्त करना। पटकथा लेखन में एक आम तौर पर अपनाया गया सिद्धांत [13,22,51] सुझाव देता है कि किसी फिल्म के कथानक में पाँच प्रकार की प्रमुख घटनाएँ होती हैं, जिन्हें टर्निंग पॉइंट (टीपी; चित्र 1 में उनकी परिभाषाएँ देखें) के रूप में जाना जाता है। दूसरा उप-कार्य भावना की भविष्यवाणी है, जिसे हम शॉट्स और उत्पन्न भावनाओं के बीच तीव्रता के प्रवाह के अनुमान के रूप में देखते हैं।


हम एक अप्रशिक्षित ग्राफ-आधारित दृष्टिकोण का पालन करते हुए प्रस्ताव ट्रेलर तैयार करते हैं। हम मूवीज़ को ऐसे ग्राफ के रूप में मॉडल करते हैं जिनके नोड शॉट होते हैं और जिनके किनारे शॉट्स के बीच महत्वपूर्ण अर्थपूर्ण कनेक्शन को दर्शाते हैं (चित्र 2 देखें)। इसके अलावा, नोड्स पर लेबल होते हैं जो दर्शाते हैं कि वे महत्वपूर्ण घटनाएँ हैं (यानी, टीपी) और भावना तीव्रता (सकारात्मक या नकारात्मक) को संकेत देने वाले स्कोर। हमारा एल्गोरिदम ट्रेलर अनुक्रम बनाने के लिए इस मूवी ग्राफ को पार करता है। इनका उपयोग मानव संपादक द्वारा समीक्षा और संशोधन किए जाने वाले प्रस्तावों के रूप में किया जा सकता है।


टीपी पहचान और भावना भविष्यवाणी दोनों ही कार्य मूवी सामग्री की निम्न-स्तरीय समझ से लाभान्वित होते हैं। वास्तव में, हम पात्रों और स्थानों की पहचान करने, क्रियाओं को पहचानने और अर्थपूर्ण इकाइयों को स्थानीयकृत करने के लिए ऑफ-द-शेल्फ मॉड्यूल का उपयोग कर सकते हैं। हालाँकि, इस तरह के दृष्टिकोण प्रशिक्षण और अनुमान के दौरान पूर्व-प्रसंस्करण समय और मेमोरी आवश्यकताओं को काफी हद तक बढ़ाते हैं और त्रुटि प्रसार से ग्रस्त हैं। इसके बजाय, हम एक विपरीत सीखने की व्यवस्था का प्रस्ताव करते हैं, जहाँ हम पटकथाओं का लाभ विशेषाधिकार प्राप्त जानकारी के रूप में लेते हैं, यानी, केवल प्रशिक्षण के समय उपलब्ध जानकारी। पटकथाएँ बताती हैं कि फिल्म को दृश्यों में कैसे विभाजित किया गया है, पात्र कौन हैं, वे कब और किससे बात कर रहे हैं, वे कहाँ हैं और क्या कर रहे हैं (यानी, "दृश्य शीर्षक" बताते हैं कि कार्रवाई कहाँ होती है जबकि "कार्रवाई रेखाएँ" बताती हैं कि कैमरा क्या देखता है)। विशेष रूप से, हम दो अलग-अलग नेटवर्क बनाते हैं, एक पटकथा पर आधारित पाठ्य नेटवर्क और एक वीडियो पर आधारित मल्टीमॉडल, और सहायक विपरीत नुकसान का उपयोग करके उन्हें संयुक्त रूप से प्रशिक्षित करते हैं। पाठ्य नेटवर्क को स्व-पर्यवेक्षित सीखने के माध्यम से पटकथाओं के बड़े संग्रह पर पूर्व-प्रशिक्षित किया जा सकता है, बिना संबंधित फिल्मों को एकत्र और संसाधित किए। प्रायोगिक परिणामों से पता चलता है कि यह विपरीत प्रशिक्षण दृष्टिकोण लाभदायक है, जिसके परिणामस्वरूप ट्रेलरों को उनकी विषय-वस्तु और आकर्षण के संदर्भ में मनुष्यों द्वारा अनुकूल रूप से आंका जाता है।


यह पेपर CC BY-SA 4.0 DEED लाइसेंस के अंतर्गत arxiv पर उपलब्ध है।


[1] https://www.studiobinder.com/blog/how-to-make-a-movie-trailer


[2] https://www.derek-lieu.com/blog/2017/9/10/the-matrix-is-a-trailereditors-dream