Auteurs:
(1) Dinesh Kumar Vishwakarma, Laboratoire de recherche biométrique, Département des technologies de l'information, Université technologique de Delhi, Delhi, Inde ;
(2) Mayank Jindal, Laboratoire de recherche biométrique, Département des technologies de l'information, Université technologique de Delhi, Delhi, Inde
(3) Ayush Mittal, Laboratoire de recherche biométrique, Département des technologies de l'information, Université technologique de Delhi, Delhi, Inde
(4) Aditya Sharma, Laboratoire de recherche biométrique, Département des technologies de l'information, Université technologique de Delhi, Delhi, Inde.
Les ensembles de données de la littérature antérieure ne présentent pas une composition uniforme des genres cinématographiques. Par conséquent, nous proposons un EMTD (English Movie Trailer Dataset) composé d'environ 2000 bandes-annonces de films hollywoodiens uniques téléchargées depuis IMDB1. EMTD contient 2000 bandes-annonces uniques de 5 genres à savoir : action, comédie, horreur, romance, science-fiction. L'ensemble de données est extrait d'IMDB par la procédure de suppression de sites Web comme suit : (1) récupérer la liste des titres de films disponibles sur IMDB (avec au moins 1 genre commun à celui mentionné ci-dessus), (2) récupérer les métadonnées correspondant à chaque titre de film, y compris la bande-annonce. lien pour télécharger, et (3) téléchargez les bandes-annonces (.mp4) correspondant au lien dans un dossier et répertoriez toutes les informations/métadonnées sur le film, y compris le nom de la bande-annonce, les descriptions, l'intrigue, les mots-clés et les genres sous la forme de un fichier CSV. Dans ce travail, l'ensemble de données est divisé en ensemble de trains (1 700 remorques) et en ensemble de validation (300 remorques), comme indiqué dans le tableau 1.
L’étude est menée avec les genres ci-dessus uniquement parce que ces genres sont principalement observés dans les films. Nous souhaitons également explorer les performances de notre architecture d'abord sur un petit ensemble de genres, nous choisissons donc de ne choisir que 5 genres au lieu de nous diriger vers un large ensemble de genres.
Cet article est disponible sur arxiv sous licence CC BY-NC-SA 4.0 DEED.