paint-brush
《黑泽明》,编剧助理:摘要和简介经过@teleplay
418 讀數
418 讀數

《黑泽明》,编剧助理:摘要和简介

经过 Teleplay Technology 5m2024/05/23
Read on Terminal Reader

太長; 讀書

在本文中,研究人员介绍了 KUROSAWA,这是一个用于情节和脚本生成的 AI 脚本编写工作台,解决了娱乐媒体中的自动化问题。
featured image - 《黑泽明》,编剧助理:摘要和简介
Teleplay Technology  HackerNoon profile picture
0-item

作者:

(1) Prerak Gandhi,印度理工学院孟买分校计算机科学与工程系,[email protected],上述作者对本文的贡献相同;

(2)Vishal Pramanik,印度理工学院孟买分校计算机科学与工程系,vishalpramanik,[email protected],上述作者对本文的贡献相同;

(3) Pushpak Bhattacharyya,印度理工学院孟买分校计算机科学与工程系

链接表

抽象的

讲故事是娱乐业的生命线——电影、电视节目和单口喜剧都需要故事。一个好的、扣人心弦的剧本是讲故事的生命线,需要创造力和资源投入。优秀的编剧很难找到,而且他们经常在巨大的时间压力下工作。因此,娱乐媒体正在积极寻求自动化。在本文中,我们介绍了一个基于人工智能的剧本写作工作台,名为 KUROSAWA,它解决了情节生成和脚本生成的任务。情节生成旨在根据提示(15-40 个字)生成连贯而有创意的情节(600-800 个字)。另一方面,脚本生成根据简短的描述(15-40 个字)以剧本格式生成场景(200-500 个字)。Kurosawa 需要数据来训练。我们使用 4 幕故事结构来手动注释情节数据集。我们创建了一个包含 1000 个手动注释的情节及其相应的提示/故事情节的数据集,以及一个包含 1000 个场景的黄金标准数据集,其中四个主要元素(场景标题、动作线、对话和角色名称)被单独标记。我们使用上述数据集对 GPT-3 进行微调以生成情节和场景。这些情节和场景首先经过评估,然后由大型著名媒体平台 ErosNow[1] 的编剧使用。我们发布了带注释的数据集和在这些数据集上训练的模型,作为自动电影情节和剧本生成的工作基准。

1. 简介

电影是全世界最受欢迎的娱乐来源之一,也是教育和社会意识的重要媒介。从好莱坞电影投资数亿美元并经常创造数十亿美元票房收入的事实可以看出电影产业的影响力。第一部电影《火车大劫案》(1903 年)是 20 世纪初拍摄的,它是黑白无声的。从那时起,这门艺术经历了几次变革,现在人们可以通过任何智能设备即时观看自己喜欢的 4K 高清电影。


纵观电影史,一部电影能否大获成功,有两个因素:情节质量和叙事方式。如果观众觉得情节乏味、老套,电影的吸引力就会大大降低。因此,编写一个富有创意、令人兴奋的剧本至关重要,而且极具挑战性。再加上时间和预算的限制,剧本编写中(至少部分)自动化的需求就变得显而易见。


基于人工智能的故事生成之前就已经被使用过。基于写作的参与-反思认知解释,计算机模型 MEXICA(Pérez and Sharples,2001)生成了短篇故事的框架。BRUTUS(Bringsjord and Ferrucci,1999)创作了具有预定主题(如背叛)的短篇故事。随着预训练的 Transformer 模型的出现,自动故事生成得到了提振。GPT-2 和 GPT-3 等 Transformer 模型被广泛用于文本生成。这些模型已经展示了生成创造性文本的能力,尽管有时会产生幻觉(Zhao et al.,2020)。这些模型生成的文本有时也缺乏连贯性和凝聚力。另一方面,基于模板的模型可以生成连贯的文本,但在生成情节中的新角色和事件方面缺乏创造力(Kale and Rastogi,2020)。


电影创作过程通常始于一个想法,然后根据该想法创建一个情节,并以此为基础构建电影剧本(图 1)。


新颖的数据集是本文的一个重要特点。我们仔细研究了宝莱坞和好莱坞电影的情节和提示。这些情节和提示分别从 Wikipedia[2] 和 IMDb[3] 中抓取。然后使用 4 幕故事结构对情节进行注释 - 这是众所周知的 3 幕结构的扩展(Field,1979)。4 幕结构和注释方法分别在附录 A.5 和第 4 节中详细说明。


图 1:编剧在创作电影剧本时遵循的思维过程。一个想法(故事情节)会引出一个情节,然后情节会转化为电影剧本。


我们引入了一个包含 1000 个好莱坞电影场景及其简短描述的数据集。剧本是从 IMSDb[4] 中抓取的。场景中标注了剧本的四个主要组成部分:剧情简介、动作台词、角色名称和对话,附录 A.4 中有详细描述


我们引入了一个称为“Kurosawa”的工作台,它由数据集和一对使用上述数据集进行微调的 GPT-3(Brown 等人,2020)模型组成。一个 GPT-3 模型根据故事情节的简短描述(15-40 个字)生成电影情节,而另一个模型根据所需场景的简短描述创建场景。


重要的是,我们向从事电影和电视节目制作、音乐和配乐制作等业务的最大的媒体平台之一提供了“黑泽明”平台,帮助来自不同电影行业的剧本和内容作者创作新的电影情节。


我们在这项工作中的贡献如下:


• 据我们所知,这是第一项根据场景描述生成电影场景的研究。


• 我们创建并公开发布两个数据集:(a) 包含 1000 条电影故事情节及其对应情节的平行数据集,(b) 包含 1000 条电影场景及其对应描述的平行数据集。在 (a) 中,我们将 IMDb 中可用的电影故事情节与维基百科中可用的对应电影情节链接起来。在 (b) 中,我们将 IMSDb 中可用的电影场景与 IMDb 中相应的描述链接起来。


• 我们根据四幕结构手动注释电影情节,四幕结构是众所周知的三幕结构的扩展(Field,1979)。来自媒体和娱乐行业的专业编剧非常密切地指导我们。


• 我们用场景的四个主要组成部分手动注释电影场景:台词、动作台词、角色名称和对话,以及场景的简短描述。


• 我们介绍了“黑泽明”:一个由多个数据集和模型组成的工作台,可以协助电影行业的剧本和场景作者。



[1] https://erosnow.com/


[2] https://www.wikipedia.org/


[3] https://www.imdb.com/


[4] https://www.imsdb.com/