paint-brush
«Куросава», помощник сценариста: Аннотация и вступлениек@teleplay
418 чтения
418 чтения

«Куросава», помощник сценариста: Аннотация и вступление

к Teleplay Technology 5m2024/05/23
Read on Terminal Reader

Слишком долго; Читать

В этой статье исследователи представляют KUROSAWA, инструмент для написания сценариев с искусственным интеллектом для создания сюжетов и сценариев, предназначенный для автоматизации развлекательных медиа.
featured image - «Куросава», помощник сценариста: Аннотация и вступление
Teleplay Technology  HackerNoon profile picture
0-item

Авторы:

(1) Прерак Ганди, факультет компьютерных наук и инженерии, Индийский технологический институт Бомбей, Мумбаи, [email protected], и эти авторы внесли равный вклад в эту работу;

(2) Вишал Праманик, факультет компьютерных наук и инженерии, Индийский технологический институт Бомбей, Мумбаи, vishalpramanik,[email protected], и эти авторы внесли равный вклад в эту работу;

(3) Пушпак Бхаттачарья, факультет компьютерных наук и инженерии, Индийский технологический институт, Бомбей, Мумбаи.

Таблица ссылок

Абстрактный

Рассказывание историй — это спасательный круг индустрии развлечений: фильмы, телешоу и стендап-комедии — всем нужны истории. Хороший и захватывающий сценарий является основой повествования и требует творческого подхода и инвестиций. Хороших сценаристов можно найти редко, и они часто работают в условиях жесткого дефицита времени. Следовательно, развлекательные СМИ активно ищут пути автоматизации. В этой статье мы представляем инструмент для написания сценариев на основе искусственного интеллекта под названием KUROSAWA, который решает задачи создания сюжета и сценария. Создание сюжета направлено на создание связного и творческого сюжета (600–800 слов) с учетом подсказки (15–40 слов). С другой стороны, генерация сценария генерирует сцену (200–500 слов) в формате сценария из краткого описания (15–40 слов). Куросаве нужны данные для обучения. Мы используем четырехактную структуру повествования, чтобы вручную аннотировать набор сюжетных данных. Мы создаем набор данных из 1000 аннотированных вручную сюжетов и соответствующих им подсказок/сюжетных линий, а также набор данных золотого стандарта из 1000 сцен с четырьмя основными элементами — заголовками сцен, линиями действия, диалогами и именами персонажей — помеченными индивидуально. Мы настраиваем GPT-3 с помощью приведенных выше наборов данных для создания графиков и сцен. Эти сюжеты и сцены сначала оцениваются, а затем используются сценаристами крупной и известной медиаплатформы ErosNow[1]. Мы выпускаем аннотированные наборы данных и модели, обученные на этих наборах данных, в качестве рабочего эталона для автоматического создания сюжетов фильмов и сценариев.

1. Введение

Фильмы являются одним из самых популярных источников развлечения для людей во всем мире и могут стать мощным средством образования и социальной осведомленности. Влияние и влияние киноиндустрии можно оценить по тому факту, что голливудские фильмы инвестируют *Эти авторы в равной степени в эту работу 1 https://erosnow.com/ сотни миллионов долларов и часто собирают миллиардные кассовые сборы. Первый кинофильм «Большое ограбление поезда, 1903» — черно-белый без звука — был создан в начале XX века. С тех пор искусство претерпело несколько трансформаций, и теперь люди могут мгновенно получить доступ к фильмам 4K HD по своему вкусу на любом интеллектуальном устройстве.


На протяжении всей истории кино успеху блокбастеров способствовали качество сюжета и манера повествования. Привлекательность фильма резко снижается, если зрители находят сюжет слишком предсказуемым. Поэтому написание творческого и захватывающего сценария является критической необходимостью и чрезвычайно сложной задачей. Добавьте к этому ограничения времени и бюджета, и необходимость (хотя бы частичной) автоматизации написания сценариев становится очевидной.


Генерация историй на основе искусственного интеллекта использовалась и раньше. Компьютерная модель MEXICA (Перес и Шарплес, 2001), основанная на когнитивном объяснении письма на основе взаимодействия и рефлексии, создает рамки для коротких рассказов. БРУТ (Брингсйорд и Ферруччи, 1999) создает рассказы с заранее заданными темами, такими как предательство. С появлением предварительно обученных моделей-трансформеров автоматическое создание историй получило новый импульс. Модели трансформеров, такие как GPT-2 и GPT-3, широко используются для генерации текста. Эти модели продемонстрировали способность генерировать творческий текст, хотя иногда и с галлюцинациями (Чжао и др., 2020). Тексту, созданному с помощью этих моделей, также иногда не хватает связности и связности. С другой стороны, модели на основе шаблонов могут генерировать связный текст, но им не хватает креативности в создании новых персонажей и событий в сюжете (Кале и Растоги, 2020).


Процесс создания фильма обычно начинается с идеи, которая затем используется для создания сюжета, который используется в качестве основы для создания сценария фильма (рис. 1).


Новые наборы данных являются важной особенностью этой статьи. Мы внимательно изучали сюжеты и подсказки фильмов Болливуда и Голливуда. Такие сюжеты и подсказки были взяты из Википедии[2] и IMDb[3] соответственно. Затем сюжеты аннотируются с использованием четырехактной структуры рассказа – расширения известной трехактной структуры (Филд, 1979). Четырехактная структура и методы аннотирования подробно описаны в приложении A.5 и разделе 4 соответственно.


Рисунок 1. Мыслительный процесс, которому следует сценарист при создании сценария фильма. Идея (сюжетная линия) приводит к сюжету, который затем преобразуется в сценарий фильма.


Мы представляем набор данных из 1000 сцен голливудских фильмов и их кратких описаний. Сценарии взяты из IMSDb[4]. Сцены сопровождаются четырьмя основными компонентами сценария: слизняками, линиями действия, именами персонажей и диалогами, подробно описанными в приложении А.4.


Мы представляем рабочую среду, которую мы называем «Куросава», состоящую из наборов данных и пары моделей GPT-3 (Brown et al., 2020), точно настроенных с использованием указанных наборов данных. Одна модель GPT-3 генерирует сюжет фильма по краткому описанию сюжетной линии (15–40 слов), а другая создает сцену на основе краткого описания необходимой сцены.


Важно отметить, что мы предоставили платформу «Куросава» одной из крупнейших медиа-платформ, занимающихся созданием фильмов и телешоу, производством музыки, саундтреков и т. д., чтобы помочь авторам сценариев и контента из различных киноиндустрии создавать новые сюжеты фильмов.


Наш вклад в эту работу заключается в следующем:


• Насколько нам известно, это первая работа по созданию сцен фильма из описания сцены.


• Мы создаем и публикуем два набора данных: (а) параллельный набор данных из 1000 сюжетных линий фильмов и соответствующих им сюжетов, (б) параллельный набор данных из 1000 сцен фильмов и соответствующих им описаний. В (а) мы связываем доступные сюжетные линии фильмов из IMDb с доступными соответствующими сюжетами фильмов из Википедии. В (b) мы связываем доступные сцены фильмов из IMSDb с соответствующими описаниями из IMDb.


• Мы вручную аннотируем сюжеты фильмов в соответствии с четырехактной структурой, которая является расширением известной трехактной структуры (Филд, 1979). Нас очень внимательно сопровождали профессиональные сценаристы из индустрии СМИ и развлечений.


• Мы вручную аннотируем сцены фильма четырьмя основными компонентами сцены: слизняками, линиями действия, именами персонажей и диалогами, а также кратким описанием сцены.


• Мы представляем «Куросаву»: инструментарий, состоящий из множества наборов данных и моделей, который может помочь сценаристам и сценаристам в киноиндустрии.


Этот документ доступен на arxiv под лицензией CC 4.0 DEED.


[1] https://erosnow.com/


[2] https://www.wikipedia.org/


[3] https://www.imdb.com/


[4] https://www.imsdb.com/