paint-brush
Profilage multiniveau des réseaux profonds basés sur la situation et le dialogue : ensemble de données EMTDpar@kinetograph

Profilage multiniveau des réseaux profonds basés sur la situation et le dialogue : ensemble de données EMTD

Trop long; Pour lire

Dans cet article, les chercheurs proposent un cadre multimodal pour la classification des genres de films, utilisant des fonctionnalités de situation, de dialogue et de métadonnées.
featured image - Profilage multiniveau des réseaux profonds basés sur la situation et le dialogue : ensemble de données EMTD
Kinetograph: The Video Editing Technology Publication HackerNoon profile picture
0-item

Auteurs:

(1) Dinesh Kumar Vishwakarma, Laboratoire de recherche biométrique, Département des technologies de l'information, Université technologique de Delhi, Delhi, Inde ;

(2) Mayank Jindal, Laboratoire de recherche biométrique, Département des technologies de l'information, Université technologique de Delhi, Delhi, Inde

(3) Ayush Mittal, Laboratoire de recherche biométrique, Département des technologies de l'information, Université technologique de Delhi, Delhi, Inde

(4) Aditya Sharma, Laboratoire de recherche biométrique, Département des technologies de l'information, Université technologique de Delhi, Delhi, Inde.

Tableau des liens

3. Ensemble de données EMTD

Les ensembles de données de la littérature antérieure ne présentent pas une composition uniforme des genres cinématographiques. Par conséquent, nous proposons un EMTD (English Movie Trailer Dataset) composé d'environ 2000 bandes-annonces de films hollywoodiens uniques téléchargées depuis IMDB1. EMTD contient 2000 bandes-annonces uniques de 5 genres à savoir : action, comédie, horreur, romance, science-fiction. L'ensemble de données est extrait d'IMDB par la procédure de suppression de sites Web comme suit : (1) récupérer la liste des titres de films disponibles sur IMDB (avec au moins 1 genre commun à celui mentionné ci-dessus), (2) récupérer les métadonnées correspondant à chaque titre de film, y compris la bande-annonce. lien pour télécharger, et (3) téléchargez les bandes-annonces (.mp4) correspondant au lien dans un dossier et répertoriez toutes les informations/métadonnées sur le film, y compris le nom de la bande-annonce, les descriptions, l'intrigue, les mots-clés et les genres sous la forme de un fichier CSV. Dans ce travail, l'ensemble de données est divisé en ensemble de trains (1 700 remorques) et en ensemble de validation (300 remorques), comme indiqué dans le tableau 1.


L’étude est menée avec les genres ci-dessus uniquement parce que ces genres sont principalement observés dans les films. Nous souhaitons également explorer les performances de notre architecture d'abord sur un petit ensemble de genres, nous choisissons donc de ne choisir que 5 genres au lieu de nous diriger vers un large ensemble de genres.


Tableau 1 : Composition de l'ensemble de données


Cet article est disponible sur arxiv sous licence CC BY-NC-SA 4.0 DEED.