paint-brush
상황 및 대화 기반 심층 네트워크의 다단계 프로파일링: EMTD 데이터세트~에 의해@kinetograph

상황 및 대화 기반 심층 네트워크의 다단계 프로파일링: EMTD 데이터세트

너무 오래; 읽다

본 논문에서 연구자들은 상황, 대사, 메타데이터 특징을 활용하여 영화 장르 분류를 위한 다중 양식 프레임워크를 제안합니다.
featured image - 상황 및 대화 기반 심층 네트워크의 다단계 프로파일링: EMTD 데이터세트
Kinetograph: The Video Editing Technology Publication HackerNoon profile picture
0-item

저자:

(1) Dinesh Kumar Vishwakarma, 인도 델리 소재 델리 기술 대학교 정보 기술부 생체 인식 연구소;

(2) Mayank Jindal, 인도 델리 소재 델리 공과대학교 정보기술학과 생체인식연구소

(3) Ayush Mittal, 인도 델리 소재 델리 기술대학교 정보기술학과 생체인식연구소

(4) Aditya Sharma, 인도 델리 소재 델리기술대학교 정보기술학과 생체인식연구소.

링크 표

3. EMTD 데이터세트

이전 문헌의 데이터 세트에는 영화 장르의 균일한 구성이 부족합니다. 따라서 우리는 IMDB1에서 다운로드한 약 2000개의 고유한 할리우드 영화 예고편으로 구성된 EMTD(English Movie Trailer Dataset)를 제안합니다. EMTD에는 액션, 코미디, 공포, 로맨스, SF 등 5개 장르의 2000개 고유 예고편이 포함되어 있습니다. 데이터 세트는 다음과 같이 웹 스크래핑 절차를 통해 IMDB에서 추출됩니다. (1) IMDB에서 사용할 수 있는 영화 제목 목록을 가져오고(위에서 언급한 장르와 공통되는 장르가 최소 1개 포함), (2) 예고편을 포함하여 각 영화 제목에 해당하는 메타데이터를 스크랩합니다. (3) 링크에 해당하는 예고편(.mp4)을 폴더에 다운로드하고 예고편 이름, 설명, 줄거리, 키워드 및 장르를 포함하여 영화에 대한 모든 정보/메타데이터를 다음 형식으로 나열합니다. CSV 파일. 이 작업에서 데이터세트는 표 1과 같이 열차 세트(1700개 예고편), 검증 세트(300개 예고편)로 분할됩니다.


위의 장르를 대상으로 연구를 진행한 이유는 영화에서 주로 이러한 장르가 관찰되기 때문이다. 또한 우리는 먼저 작은 장르에서 우리 아키텍처의 성능을 탐색하고 싶기 때문에 광범위한 장르를 지향하는 대신 5가지 장르만 선택합니다.


표 1: 데이터 세트 구성


이 문서는 CC BY-NC-SA 4.0 DEED 라이센스에 따라 arxiv에서 볼 수 있습니다 .