저자:
(1) Prerak Gandhi, 인도 봄베이 기술 연구소(뭄바이 소재) 컴퓨터 공학부 [email protected] 및 이들 저자는 이 작업에 동일하게 기여했습니다.
(2) Vishal Pramanik, 인도 봄베이 기술 연구소(뭄바이 소재) 컴퓨터 공학부, vishalpramanik,[email protected], 이들 저자는 이 작업에 동일하게 기여했습니다.
(3) Pushpak Bhattacharyya, 뭄바이 인도 봄베이 기술 연구소 컴퓨터 공학부.
신경 모델은 시각적 요소(Huang et al., 2016) 및 간결한 텍스트 설명(Jain et al., 2017)과 같은 다양한 콘텐츠를 조건으로 스토리를 생성할 수 있었습니다. 플롯을 제어할 수 있고 계획 중심의 스토리 생성 작업이 많습니다(Riedl and Young, 2010; Fan et al., 2019; Pérez and Sharples, 2001; Rashkin et al., 2020). 이와 관련된 작업으로는 키워드나 설명을 기반으로 한 자동 시 생성이 있다(Yan, 2016; Wang et al., 2016).
Plot Machines(Rashkin et al., 2020)는 일부 개요 문구를 기반으로 여러 단락 스토리를 생성합니다. 팬 외. (2018)은 계층적 시퀀스-시퀀스 융합 모델을 도입하여 최대 1000 단어의 스토리를 생성하는 전제와 조건을 생성합니다. 이 작업은 우리 작업과 달리 비신경적이고 템플릿 중심적이므로 우리가 생성한 작업에 비해 창의성과 참신함이 훨씬 떨어집니다.
자동 장면이나 스크립트 생성은 비교적 덜 주목을 받았습니다. 장면 생성과 유사한 대화 생성(Li et al., 2016; Huang et al., 2018; Tang et al., 2019; Wu et al., 2019)이 완료되었습니다. 최근 내러티브의 도움으로 대화를 안내하는 데 초점을 맞춘 일부 작업이 있었습니다(Zhu et al., 2020). 우리는 주요 요소가 입력되는 작은 프롬프트에서 나오는 장면을 생성합니다.
이 문서는 CC 4.0 DEED 라이선스에 따라 arxiv에서 볼 수 있습니다.