paint-brush
«Куросава»: Помощник сценариста: Приложениек@teleplay
149 чтения

«Куросава»: Помощник сценариста: Приложение

к Teleplay Technology 5m2024/05/23
Read on Terminal Reader

Слишком долго; Читать

В этой статье исследователи представляют KUROSAWA, инструмент для написания сценариев с искусственным интеллектом для создания сюжетов и сценариев, предназначенный для автоматизации развлекательных медиа.
featured image - «Куросава»: Помощник сценариста: Приложение
Teleplay Technology  HackerNoon profile picture
0-item

Авторы:

(1) Прерак Ганди, факультет компьютерных наук и инженерии, Индийский технологический институт, Бомбей, Мумбаи, [email protected], и эти авторы внесли равный вклад в эту работу;

(2) Вишал Праманик, факультет компьютерных наук и инженерии, Индийский технологический институт Бомбей, Мумбаи, vishalpramanik,[email protected], и эти авторы внесли равный вклад в эту работу;

(3) Пушпак Бхаттачария, факультет компьютерных наук и инженерии, Индийский технологический институт, Бомбей, Мумбаи.

Таблица ссылок

А. Приложение

А.1. Вопросы этики

Все скрипты мы взяли из баз данных IMDB и IMSDb. На веб-сайте имеется заявление об отказе от ответственности в отношении использования его сценариев для исследований, которое можно найти по этой ссылке https://imsdb.com/disclaimer.html. Мы использовали сценарии добросовестно и без нарушения авторских прав.

А.2. Профили аннотаторов

Нам потребовалась помощь внешних аннотаторов в двух случаях: (i) аннотирование сценариев вручную и (ii) создание сцен и их описаний из сценариев. Для первой задачи мы воспользовались помощью 10 аннотаторов. Их возраст варьировался от 21 до 28 лет, и все они были азиатами. Им были даны подробные инструкции с примерами для аннотирования. Также проводились периодические сеансы для подтверждения их понимания и разрешения их сомнений и ошибок. Для второй задачи мы воспользовались помощью двух аннотаторов. Обе они азиатские женщины в возрасте от 21 до 23 лет. Им обоим были даны подробные инструкции по написанию сцен. Несколько точек данных были выбраны случайным образом и проверены, чтобы выявить и исправить концептуальные ошибки. Аннотаторы имели степень бакалавра и магистра в области STEM и искусств.

А.3. Метрики оценки

Метрики оценки описаны ниже:


• Недоумение (PPL). Недоумение — один из наиболее распространенных показателей оценки языковых моделей. Они вычисляются как экспонента энтропии. Чем меньше значение PPL, тем выше беглость создаваемого текста.


• BLEU: двуязычная оценка . Недоученность — общий показатель во многих задачах НЛП, особенно в области машинного перевода. Он измеряет перекрытие между полученным объемом производства и данными золотого стандарта. Хотя эта метрика не учитывает креативность модели, мы можем определить разницу между текстом-кандидатом и текстом ссылки, используя BLEU. Чем выше показатель BLEU, тем лучше.


• ROUGE: Оценка , ориентированная на запоминание , обычно используется для оценки автоматического суммирования. В нашем случае он измеряет самую длинную перекрывающуюся последовательность между сгенерированными и исходными графиками. Чем выше показатель ROUGE, тем лучше.


• N-граммы: мы измеряем избыточность и разнообразие сюжетов фильмов, вычисляя показатели повторения и различия n-грамм.

А.4. Структура сценария

Сценарий фильма или сценарий имеет другой формат, чем история. Сценарий — это группа сцен. Каждая из этих сцен состоит из нескольких основных компонентов, которые обсуждаются ниже:


Заголовки сцен/слейны. Этот компонент описывает, когда и где происходит сцена. Его можно рассматривать как первый снимок новой сцены, сделанный камерой. Например, ИНТ. - РЕСТОРАН - НОЧЬ указывает, что сцена начинается в ночном ресторане. Слизни обычно пишутся заглавными буквами и выравниваются по левому краю.


Имена персонажей — они упоминаются каждый раз, когда персонаж собирается произнести диалог. Имя каждого символа указывается в верхнем регистре и выравнивается по центру.


Диалоги – диалоги – это строки, которые произносят персонажи. Они появляются сразу после имени персонажа в сценарии и выравниваются по центру.


Линии действия — линии действия описывают практически все в сцене. Их можно охарактеризовать как повествование каждого сценария. Линии действий могут присутствовать после диалогов или слизней линии и выравниваются по левому краю.


Переходы — переход отмечает переход от одной сцены к другой. Они также показывают, как закончилась сцена. Например, DISSOLVE, FADE и CUT — это разные ключевые слова, используемые для обозначения перехода. Обычно они написаны заглавными буквами и выравниваются по правому краю.


На рис. 8 показан пример элементов сценария.

А.5. Шаблоны историй

Со временем были разработаны различные шаблоны, помогающие создавать истории. Одним из самых известных шаблонов является трехактная структура (Филд, 1979). Эта структура делит историю на завязку, конфронтацию и развязку. В данной работе мы использовали четырехактную структуру, которую сейчас подробно опишем.


Акт 1. Это вступительный акт. Он описывает характер главного героя и кратко представляет тему фильма. Действие заканчивается началом нового путешествия главного героя.


Акт 2А . Из-за большого объёма Акта 2 его можно разделить на два акта. Этот акт обычно является началом любовной истории. Это также развлекает публику, поскольку главный герой пытается адаптироваться к своему новому путешествию. Акт заканчивается в середине фильма, одном из критических моментов фильма, либо очень положительной, либо отрицательной сценой.


Акт 2B . Обычно в этом акте происходит падение главного героя. Злодей или антагонист начинает получать преимущество, а главный герой теряет что-то или кого-то существенного. Акт заканчивается тем, что главный герой реализует свою новую миссию, достигнув дна.


Акт 3. Главный герой осознал, что ему необходимо измениться, и намеревается победить антагониста в захватывающем финале. Затем фильм заканчивается долгожданным изменением главного героя, которого не хватало вначале.


Рисунок 6: Пример ручной аннотации сюжета фильма «Музыка сердца» с использованием 4-актной структуры.

А.6. Точная настройка GPT-3

GPT-3 был признан общедоступным в прошлом году OpenAI (Brown et al., 2020). Его лучшая модель имеет 175B параметров, что намного больше, чем 2,9B параметров у GPT2. У нас есть точно настроенные модели создания нескольких сюжетов с помощью GPT-3, а также модель создания сцен. Множественные комбинации моделей создания сюжета представляют собой короткие или длинные подсказки, с жанрами или без них. Модель GPT-3 и гиперпараметры остаются одинаковыми для всех вышеперечисленных комбинаций. Мы доработали модель Кюри GPT-3 для четырех эпох. Для генерации текста GPT-3 предлагает различные гиперпараметры, которые можно настроить и приблизиться к желаемым результатам. Для тестирования мы установили другие гиперпараметры следующим образом: температуру — 0,7, top-p — 1, штраф за частоту — 0,1, штраф за присутствие — 0,1 и максимальное количество токенов — 900.


Рисунок 7. Пример полной сцены, созданной на основе коротких входных данных.


Рисунок 8. Элементы сценария


Этот документ доступен на arxiv под лицензией CC 4.0 DEED.