paint-brush
„Kurosawa“, Assistent eines Drehbuchautors: Zusammenfassung und Einleitungvon@teleplay
418 Lesungen
418 Lesungen

„Kurosawa“, Assistent eines Drehbuchautors: Zusammenfassung und Einleitung

von Teleplay Technology 5m2024/05/23
Read on Terminal Reader

Zu lang; Lesen

In diesem Artikel stellen Forscher KUROSAWA vor, eine KI-Drehbuch-Workbench für die Plot- und Skripterstellung, die sich mit der Automatisierung in Unterhaltungsmedien befasst.
featured image - „Kurosawa“, Assistent eines Drehbuchautors: Zusammenfassung und Einleitung
Teleplay Technology  HackerNoon profile picture
0-item

Autoren:

(1) Prerak Gandhi, Department of Computer Science and Engineering, Indian Institute of Technology Bombay, Mumbai, [email protected], und diese Autoren haben zu gleichen Teilen zu dieser Arbeit beigetragen;

(2) Vishal Pramanik, Department of Computer Science and Engineering, Indian Institute of Technology Bombay, Mumbai, vishalpramanik,[email protected], und diese Autoren haben zu gleichen Teilen zu dieser Arbeit beigetragen;

(3) Pushpak Bhattacharyya, Abteilung für Informatik und Ingenieurwesen, Indian Institute of Technology Bombay, Mumbai.

Linktabelle

Abstrakt

Geschichtenerzählen ist die Lebensader der Unterhaltungsindustrie – Filme, Fernsehsendungen und Stand-up-Comedys brauchen alle Geschichten. Ein gutes und fesselndes Drehbuch ist die Lebensader des Geschichtenerzählens und erfordert Kreativität und Ressourceneinsatz. Gute Drehbuchautoren sind rar gesät und arbeiten oft unter enormem Zeitdruck. Daher suchen Unterhaltungsmedien aktiv nach Automatisierung. In diesem Artikel stellen wir eine KI-basierte Drehbuch-Workbench namens KUROSAWA vor, die sich mit den Aufgaben der Plot- und Skriptgenerierung befasst. Die Plot-Generierung zielt darauf ab, aus einer vorgegebenen Vorlage (15–40 Wörter) einen kohärenten und kreativen Plot (600–800 Wörter) zu generieren. Die Skriptgenerierung hingegen generiert aus einer kurzen Beschreibung (15–40 Wörter) eine Szene (200–500 Wörter) im Drehbuchformat. Kurosawa benötigt Daten zum Trainieren. Wir verwenden eine 4-Akt-Struktur des Geschichtenerzählens, um den Plot-Datensatz manuell zu annotieren. Wir erstellen einen Datensatz mit 1000 manuell annotierten Plots und den dazugehörigen Prompts/Handlungssträngen sowie einen Goldstandard-Datensatz mit 1000 Szenen mit vier Hauptelementen – Szenenüberschriften, Handlungsstränge, Dialoge und Charakternamen – die einzeln markiert sind. Wir optimieren GPT-3 mit den oben genannten Datensätzen, um Plots und Szenen zu generieren. Diese Plots und Szenen werden zunächst ausgewertet und dann von den Drehbuchautoren einer großen und bekannten Medienplattform, ErosNow[1], verwendet. Wir veröffentlichen die annotierten Datensätze und die auf diesen Datensätzen trainierten Modelle als funktionierenden Benchmark für die automatische Generierung von Filmplots und Drehbüchern.

1. Einleitung

Filme sind eine der beliebtesten Unterhaltungsquellen für Menschen weltweit und können ein starkes Medium für Bildung und soziales Bewusstsein sein. Die Wirkung und der Einfluss der Filmindustrie lassen sich daran ablesen, dass Hollywood-Filme Hunderte Millionen Dollar investieren und oft Einspielergebnisse von mehreren Milliarden Dollar erzielen. Der erste Kinofilm „Der große Eisenbahnraub“ von 1903 – schwarz-weiß und ohne Ton – entstand zu Beginn des 20. Jahrhunderts. Seitdem hat die Kunst mehrere Wandlungen durchgemacht und heute können die Menschen sofort auf jedem Smartgerät auf 4K-HD-Filme ihrer Wahl zugreifen.


Im Laufe der Filmgeschichte haben die Qualität der Handlung und die Art des Erzählens zwei Faktoren zum Erfolg eines Blockbusters beigetragen. Die Attraktivität eines Films nimmt drastisch ab, wenn die Zuschauer die Handlung als erbärmlich vorhersehbar empfinden. Das Schreiben eines kreativen und spannenden Drehbuchs ist daher eine entscheidende Notwendigkeit und eine äußerst anspruchsvolle Aufgabe. Hinzu kommen die zeitlichen und finanziellen Einschränkungen, und die Notwendigkeit einer (zumindest teilweisen) Automatisierung des Drehbuchschreibens wird offensichtlich.


KI-basierte Geschichtenerstellung wurde schon früher eingesetzt. Basierend auf der kognitiven Erklärung des Schreibens durch Engagement und Reflexion generiert das Computermodell MEXICA (Pérez und Sharples, 2001) Rahmen für Kurzgeschichten. BRUTUS (Bringsjord und Ferrucci, 1999) erstellt Kurzgeschichten mit vorgegebenen Themen wie Verrat. Mit dem Aufkommen vorab trainierter Transformer-Modelle hat die automatische Geschichtenerstellung einen Aufschwung erlebt. Transformer-Modelle wie GPT-2 und GPT-3 werden häufig zur Texterstellung verwendet. Diese Modelle haben gezeigt, dass sie in der Lage sind, kreative Texte zu generieren, wenn auch manchmal mit Halluzinationen (Zhao et al., 2020). Dem von diesen Modellen generierten Text mangelt es manchmal auch an Kohärenz und Zusammenhalt. Auf der anderen Seite können vorlagenbasierte Modelle kohärente Texte generieren, es fehlt ihnen jedoch an Kreativität bei der Generierung neuer Charaktere und Ereignisse in der Handlung (Kale und Rastogi, 2020).


Der Entstehungsprozess eines Films beginnt im Allgemeinen mit einer Idee, die dann zur Entwicklung einer Handlung verwendet wird, die wiederum als Grundlage für die Erstellung des Drehbuchs dient (Abbildung 1).


Neuartige Datensätze sind ein wichtiger Aspekt dieses Papiers. Wir haben die Handlungsstränge und Handlungsanweisungen von Filmen aus Bollywood und Hollywood genau untersucht. Diese Handlungsstränge und Handlungsanweisungen wurden aus Wikipedia[2] bzw. IMDb[3] entnommen. Die Handlungsstränge werden dann mithilfe der 4-Akt-Struktur annotiert – einer Erweiterung der bekannten 3-Akt-Struktur (Field, 1979). Die 4-Akt-Struktur und die Annotationsmethoden werden im Anhang A.5 bzw. Abschnitt 4 ausführlich erläutert.


Abbildung 1: Der Denkprozess, den ein Drehbuchautor beim Schreiben eines Filmskripts durchläuft. Aus einer Idee (Handlungsstrang) entsteht ein Plot, der dann in ein Filmskript umgesetzt wird.


Wir stellen einen Datensatz von 1000 Hollywood-Filmszenen und ihren Kurzbeschreibungen vor. Die Drehbücher stammen aus IMSDb[4]. Die Szenen sind mit den vier Hauptkomponenten eines Drehbuchs annotiert: Sluglines, Actionlines, Charakternamen und Dialoge, die im Anhang A.4 ausführlich beschrieben werden.


Wir führen eine Workbench ein, die wir „Kurosawa“ nennen und die aus Datensätzen und einem Paar GPT-3-Modellen (Brown et al., 2020) besteht, die mit den besagten Datensätzen fein abgestimmt sind. Ein GPT-3-Modell generiert eine Filmhandlung anhand einer kurzen Beschreibung der Handlung (15–40 Wörter), während das andere eine Szene basierend auf einer kurzen Beschreibung der gewünschten Szene erstellt.


Wichtig ist, dass wir die Plattform „Kurosawa“ einer der größten Medienplattformen zur Verfügung gestellt haben, die sich mit der Herstellung von Filmen und Fernsehsendungen sowie der Produktion von Musik und Soundtracks usw. beschäftigt – um Drehbuch- und Inhaltsautoren aus verschiedenen Filmbranchen bei der Entwicklung neuer Filmhandlungen zu unterstützen.


Unsere Beiträge zu dieser Arbeit sind wie folgt:


• Nach bestem Wissen und Gewissen handelt es sich hierbei um die erste Arbeit zur Generierung von Filmszenen aus einer Szenenbeschreibung.


• Wir erstellen und veröffentlichen zwei Datensätze: (a) einen parallelen Datensatz mit 1000 Filmhandlungen und den dazugehörigen Plots, (b) einen parallelen Datensatz mit 1000 Filmszenen und den dazugehörigen Beschreibungen. In (a) verknüpfen wir verfügbare Filmhandlungen von IMDb mit verfügbaren dazugehörigen Filmplots von Wikipedia. In (b) verknüpfen wir verfügbare Filmszenen von IMSDb mit den dazugehörigen Beschreibungen von IMDb.


• Wir kommentieren Filmhandlungen manuell nach einer 4-Akt-Struktur, die eine Erweiterung der bekannten 3-Akt-Struktur darstellt (Field, 1979). Professionelle Drehbuchautoren aus der Medien- und Unterhaltungsbranche haben uns eng angeleitet.


• Wir kommentieren Filmszenen manuell mit vier Hauptkomponenten einer Szene: Sluglines, Actionlines, Charakternamen und Dialoge sowie einer kurzen Beschreibung der Szene.


• Wir stellen „Kurosawa“ vor: eine Workbench, die aus mehreren Datensätzen und Modellen besteht, die Drehbuch- und Szenenautoren in der Filmindustrie unterstützen können.



[1] https://erosnow.com/


[2] https://www.wikipedia.org/


[3] https://www.imdb.com/


[4] https://www.imsdb.com/