लेखक:
(1) दिनेश कुमार विश्वकर्मा, बायोमेट्रिक अनुसंधान प्रयोगशाला, सूचना प्रौद्योगिकी विभाग, दिल्ली प्रौद्योगिकी विश्वविद्यालय, दिल्ली, भारत;
(2) मयंक जिंदल, बायोमेट्रिक अनुसंधान प्रयोगशाला, सूचना प्रौद्योगिकी विभाग, दिल्ली प्रौद्योगिकी विश्वविद्यालय, दिल्ली, भारत
(3) आयुष मित्तल, बायोमेट्रिक अनुसंधान प्रयोगशाला, सूचना प्रौद्योगिकी विभाग, दिल्ली प्रौद्योगिकी विश्वविद्यालय, दिल्ली, भारत
(4) आदित्य शर्मा, बायोमेट्रिक अनुसंधान प्रयोगशाला, सूचना प्रौद्योगिकी विभाग, दिल्ली प्रौद्योगिकी विश्वविद्यालय, दिल्ली, भारत।
पिछले साहित्य में डेटासेट में मूवी शैलियों की एक समान संरचना का अभाव है। इसलिए, हम IMDB1 से डाउनलोड किए गए लगभग 2000 अद्वितीय हॉलीवुड मूवी ट्रेलरों से युक्त एक EMTD (अंग्रेजी मूवी ट्रेलर डेटासेट) प्रस्तावित करते हैं। EMTD में 5 शैलियों के 2000 अद्वितीय ट्रेलर हैं: एक्शन, कॉमेडी, हॉरर, रोमांस, विज्ञान कथा। डेटासेट को IMDB से वेब स्क्रैपिंग प्रक्रिया द्वारा निम्नानुसार निकाला जाता है: (1) IMDB पर उपलब्ध मूवी टाइटल की सूची प्राप्त करें (ऊपर वर्णित एक के लिए कम से कम 1 शैली सामान्य के साथ), (2) डाउनलोड करने के लिए ट्रेलर लिंक सहित प्रत्येक मूवी टाइटल से संबंधित मेटाडेटा को स्क्रैप करें, और (3) लिंक से संबंधित ट्रेलरों (.mp4) को एक फ़ोल्डर में डाउनलोड करें,
अध्ययन केवल उपरोक्त शैलियों के साथ किया जाता है क्योंकि ज़्यादातर ये शैलियाँ फ़िल्मों में देखी जाती हैं। हम पहले शैलियों के एक छोटे समूह पर अपने आर्किटेक्चर के प्रदर्शन का पता लगाना चाहते हैं, इसलिए हम शैलियों के एक व्यापक समूह की ओर जाने के बजाय केवल 5 शैलियों को चुनते हैं।
यह पेपर CC BY-NC-SA 4.0 DEED लाइसेंस के अंतर्गत arxiv पर उपलब्ध है।