著者:
(1)Prerak Gandhi、インド工科大学ボンベイ校コンピュータサイエンス工学部、ムンバイ、[email protected]、およびこれらの著者は本研究に等しく貢献した。
(2)ヴィシャル・プラマニック、インド工科大学ボンベイ校コンピュータサイエンス工学部、ムンバイ、vishalpramanik、[email protected]、およびこれらの著者は本研究に等しく貢献した。
(3)プシュパク・バタチャリヤ、インド工科大学ボンベイ校コンピュータサイエンス工学部、ムンバイ。
ニューラルモデルは、ビジュアル (Huang et al., 2016) や簡潔なテキスト記述 (Jain et al., 2017) などのさまざまなコンテンツを条件としてストーリーを生成することができます。プロット制御可能で計画主導のストーリー生成に関する研究は数多くあります (Riedl and Young, 2010; Fan et al., 2019; Pérez and Sharples, 2001; Rashkin et al., 2020)。関連する種類の研究として、キーワードや記述に基づく自動詩生成があります (Yan, 2016; Wang et al., 2016)。
プロットマシン (Rashkin 他、2020) は、いくつかのアウトラインフレーズに基づいて複数段落のストーリーを生成します。Fan 他 (2018) は、階層的なシーケンスツーシーケンス融合モデルを導入して前提と条件を生成し、最大 1000 語のストーリーを生成します。この研究は、私たちの研究とは異なり、非ニューラルでテンプレート駆動型であるため、私たちが生成したものに比べて創造性と斬新さがはるかに劣ります。
自動シーン生成やスクリプト生成は、比較的注目されていません。シーン生成に似た対話生成 (Li et al., 2016; Huang et al., 2018; Tang et al., 2019; Wu et al., 2019) は行われてきました。最近では、ナラティブの助けを借りて対話を導くことに焦点を当てた研究がいくつか行われています (Zhu et al., 2020)。私たちは、入力として小さなプロンプトから主要な要素が来るシーンを生成します。
この論文は、CC 4.0 DEED ライセンスの下でarxiv で公開されています。