Авторы:
(1) Прерак Ганди, факультет компьютерных наук и инженерии, Индийский технологический институт, Бомбей, Мумбаи, [email protected], и эти авторы внесли равный вклад в эту работу;
(2) Вишал Праманик, факультет компьютерных наук и инженерии, Индийский технологический институт Бомбей, Мумбаи, vishalpramanik,[email protected], и эти авторы внесли равный вклад в эту работу;
(3) Пушпак Бхаттачария, факультет компьютерных наук и инженерии, Индийский технологический институт, Бомбей, Мумбаи.
Все скрипты мы взяли из баз данных IMDB и IMSDb. На веб-сайте имеется заявление об отказе от ответственности в отношении использования его сценариев для исследований, которое можно найти по этой ссылке https://imsdb.com/disclaimer.html. Мы использовали сценарии добросовестно и без нарушения авторских прав.
Нам потребовалась помощь внешних аннотаторов в двух случаях: (i) аннотирование сценариев вручную и (ii) создание сцен и их описаний из сценариев. Для первой задачи мы воспользовались помощью 10 аннотаторов. Их возраст варьировался от 21 до 28 лет, и все они были азиатами. Им были даны подробные инструкции с примерами для аннотирования. Также проводились периодические сеансы для подтверждения их понимания и разрешения их сомнений и ошибок. Для второй задачи мы воспользовались помощью двух аннотаторов. Обе они азиатские женщины в возрасте от 21 до 23 лет. Им обоим были даны подробные инструкции по написанию сцен. Несколько точек данных были выбраны случайным образом и проверены, чтобы выявить и исправить концептуальные ошибки. Аннотаторы имели степень бакалавра и магистра в области STEM и искусств.
Метрики оценки описаны ниже:
• Недоумение (PPL). Недоумение — один из наиболее распространенных показателей оценки языковых моделей. Они вычисляются как экспонента энтропии. Чем меньше значение PPL, тем выше беглость создаваемого текста.
• BLEU: двуязычная оценка . Недоученность — общий показатель во многих задачах НЛП, особенно в области машинного перевода. Он измеряет перекрытие между полученным объемом производства и данными золотого стандарта. Хотя эта метрика не учитывает креативность модели, мы можем определить разницу между текстом-кандидатом и текстом ссылки, используя BLEU. Чем выше показатель BLEU, тем лучше.
• ROUGE: Оценка , ориентированная на запоминание , обычно используется для оценки автоматического суммирования. В нашем случае он измеряет самую длинную перекрывающуюся последовательность между сгенерированными и исходными графиками. Чем выше показатель ROUGE, тем лучше.
• N-граммы: мы измеряем избыточность и разнообразие сюжетов фильмов, вычисляя показатели повторения и различия n-грамм.
Сценарий фильма или сценарий имеет другой формат, чем история. Сценарий — это группа сцен. Каждая из этих сцен состоит из нескольких основных компонентов, которые обсуждаются ниже:
Заголовки сцен/слейны. Этот компонент описывает, когда и где происходит сцена. Его можно рассматривать как первый снимок новой сцены, сделанный камерой. Например, ИНТ. - РЕСТОРАН - НОЧЬ указывает, что сцена начинается в ночном ресторане. Слизни обычно пишутся заглавными буквами и выравниваются по левому краю.
Имена персонажей — они упоминаются каждый раз, когда персонаж собирается произнести диалог. Имя каждого символа указывается в верхнем регистре и выравнивается по центру.
Диалоги – диалоги – это строки, которые произносят персонажи. Они появляются сразу после имени персонажа в сценарии и выравниваются по центру.
Линии действия — линии действия описывают практически все в сцене. Их можно охарактеризовать как повествование каждого сценария. Линии действий могут присутствовать после диалогов или слизней линии и выравниваются по левому краю.
Переходы — переход отмечает переход от одной сцены к другой. Они также показывают, как закончилась сцена. Например, DISSOLVE, FADE и CUT — это разные ключевые слова, используемые для обозначения перехода. Обычно они написаны заглавными буквами и выравниваются по правому краю.
На рис. 8 показан пример элементов сценария.
Со временем были разработаны различные шаблоны, помогающие создавать истории. Одним из самых известных шаблонов является трехактная структура (Филд, 1979). Эта структура делит историю на завязку, конфронтацию и развязку. В данной работе мы использовали четырехактную структуру, которую сейчас подробно опишем.
Акт 1. Это вступительный акт. Он описывает характер главного героя и кратко представляет тему фильма. Действие заканчивается началом нового путешествия главного героя.
Акт 2А . Из-за большого объёма Акта 2 его можно разделить на два акта. Этот акт обычно является началом любовной истории. Это также развлекает публику, поскольку главный герой пытается адаптироваться к своему новому путешествию. Акт заканчивается в середине фильма, одном из критических моментов фильма, либо очень положительной, либо отрицательной сценой.
Акт 2B . Обычно в этом акте происходит падение главного героя. Злодей или антагонист начинает получать преимущество, а главный герой теряет что-то или кого-то существенного. Акт заканчивается тем, что главный герой реализует свою новую миссию, достигнув дна.
Акт 3. Главный герой осознал, что ему необходимо измениться, и намеревается победить антагониста в захватывающем финале. Затем фильм заканчивается долгожданным изменением главного героя, которого не хватало вначале.
GPT-3 был признан общедоступным в прошлом году OpenAI (Brown et al., 2020). Его лучшая модель имеет 175B параметров, что намного больше, чем 2,9B параметров у GPT2. У нас есть точно настроенные модели создания нескольких сюжетов с помощью GPT-3, а также модель создания сцен. Множественные комбинации моделей создания сюжета представляют собой короткие или длинные подсказки, с жанрами или без них. Модель GPT-3 и гиперпараметры остаются одинаковыми для всех вышеперечисленных комбинаций. Мы доработали модель Кюри GPT-3 для четырех эпох. Для генерации текста GPT-3 предлагает различные гиперпараметры, которые можно настроить и приблизиться к желаемым результатам. Для тестирования мы установили другие гиперпараметры следующим образом: температуру — 0,7, top-p — 1, штраф за частоту — 0,1, штраф за присутствие — 0,1 и максимальное количество токенов — 900.
Этот документ доступен на arxiv под лицензией CC 4.0 DEED.