著者:
(1)PIOTR MIROWSKIとKORY W. MATHEWSON、DeepMind、英国、両著者は本研究に同等の貢献をした。
(2)ジェイレン・ピットマン、スタンフォード大学、米国およびディープマインド在籍時の研究
(3)リチャード・エヴァンス、ディープマインド、英国
A. 自動ストーリー生成と制御可能なストーリー生成に関する関連研究
B. PLAYS BY BOTSクリエイティブチームによる追加ディスカッション
15 人の参加者 (p1、p2 などとして匿名化) とのインタビューを通じて、Dramatron との共同執筆に関する質的なフィードバックを収集しました。このセクションでは、このフィードバックを 7 つのテーマにまとめます。各テーマは、参加者のインタビューからの引用とともに提示されます。
(1)ドラマトロンに関する肯定的なコメントは、作家が物語の流れに沿って作業できる階層的な生成、対話的に共同執筆するか、システムに生成させるかの選択が可能であること、出力スクリプトが人間の作家のソース資料として役立つ可能性があること(セクション5.1)に焦点が当てられていました。
(2)参加者は、インスピレーション、世界構築、コンテンツ生成がドラマトロンの潜在的な執筆用途であると認識し、ドラマトロンを文学分析のためのツールとして利用できる可能性があると考えた(セクション5.2)。
(3)参加者は言語モデルに埋め込まれた様々なバイアスに気づいた(第5.3節)。
(4)一部の作家は、ドラマトロンの不本意なグリッチの美学や、繰り返しや対話のループなどの失敗モードに興味を持っていた(第5.4節)。
(5)当然のことながら、参加者は、物語の論理的ギャップ、常識の欠如、ニュアンスやサブテキストに気づき、それが登場人物の動機付けの欠如として現れた(セクション5.5)。
(6)構造批評は、ログラインを作成する必要性と、並行した対話生成による連続するシーン間の矛盾に焦点を当てた(セクション5.6)。
(7)参加者はツールに積極的に参加し、改善のための提案を積極的に行いました(セクション5.7)。
5.1.1 Dramatron のインタラクティブな階層的生成に対する賞賛。p4と p5 (非線形の執筆ワークフローを好んだ) を除くすべての参加者は、インタラクティブな階層的生成に熱心でした。「これを見ると、シリーズの形がわかります。ストーリーの展開方法もわかります。物語をより明確に見ることができます [...] ログ ラインを作成し、その中に詳細を詰め込むこのアプローチが気に入っています。アイデアの種を植え、骨に肉を付けるのです」(p13)。「すべてが非常に一貫しており、象徴的に一貫しており、一貫性があり、劇の状況と関連しています [...] いくつかの世代には、人間関係に関する感情と内容がたくさんあります」(p8)。「インタラクティブな共著プロセスに関しては、素晴らしいと思います [...] 」(p9)。「階層の好きなところは、どのレベルでも好きなだけ人間らしさを表現できることです」(p2)。 「機械を使って作業すると、内容がもう少しはっきり見えるようになりました。具体性やキャラクターアークがあるので、ストーリーがどのようにまとまるのかがわかります [...] この [階層的生成] は、私が使用していたプロセス [GPT-2 またはフラットプロンプト付き GPT-3] よりもはるかにクリーンに感じました」(p15)。「もっと試してみましょう。ああ、こんなことをしていては時間の無駄になるかもしれません」(p3)。参加者 p1、p6、p3 はさらに、このような階層的生成が対話にどのように役立つかを指摘しました。「どの世代にも良い内容があります」(p1)、(世代の 1 つを指して)「そこには大きな深い議論があります。これには感心しました」(p3)。
5.1.2 Dramatron の UI とシードベースの生成の使いやすさ。参加者 p13 は、タイトル、キャラクター、プロットをインタラクティブに段階的に生成するユーザー エクスペリエンスを気に入ったのに対し、p10 は「スクリプト全体を編集するのではなく、事前に生成しておくと、対話が簡単に思える」と考えました。参加者 p1 は、スクリプト生成の 3 つの異なるモードを試し、議論しました。1) インタラクティブな共同執筆、2) 完全に自動化された 1 つの生成からの出力の修正、3) 3~4 世代からの出力のキュレーションと修正です。複数の世代を実行する利点には、「素材が豊富」、「優れたアイデアを引き出す」、「厳選」、「より多くの解釈と芸術的自由」が可能になるが、「自分の側でより多くの調整が必要」、「流れを作るために言葉の工夫が必要」などがあります (p1)。参加者 p1 は、登場人物のリストを編集し、ログ ラインを編集して「私たちが知っている登場人物」をさらに追加し、登場人物にステータスと名前を付け、プロットのビートに追加することを含む、脚本を共同で作成するためのワークフローを開発しました。ログ ラインを作成する際、p1 は高い賭けを暗示し、「人間型の登場人物にとどまる: 人間以外の登場人物は、私たちを不条理劇場、シュール、魔法のリアリズムに連れて行く」ことを望み、ストーリーを「観客の期待に応える」ために、そして「物事を特定の場所に設定する」ために、ログ ラインで現実に位置づけることを望みました。
5.1.3 編集後の脚本を上演する可能性について。何人かの参加者 (p6、p9、p11、p13、p15) は、編集後の脚本を上演する可能性を強調しました。「下書きなので、かなり作業が必要ですが、間違いなく役に立ち、上演できるでしょう」(p6)、「1 つのアイデアで完全な番組を作る方法について考えさせられます」(p11)、「少し編集すれば、Netflix に持っていくことができます。少し微調整するだけでよいのです」(p9)。参加者 p1 は、Dramatron で生成されたいくつかの脚本を上演しました (セクション 5.9 を参照)。
5.2.1 作家へのインスピレーション。参加者全員が、Dramtron がインスピレーションを得るのに役立ったと感じています。「これは作家のスランプにぴったりです」(p13)、「行き詰まったときにとても役立つと思います」(p4、p5)、「作家のスランプ解消のヒントのウェブサイトよりも詳細です」(p3)。Dramtron は、劇作家の創造性を間接的に刺激するツールとして説明されています。「モデルの出力をいくつか読んだときに頭の中で起こることが気に入っています。ストーリーの残りの部分のアイデアが浮かびました」(p6)、「モデルから得られるものから何を翻訳するかを自分で発見するのです」(p10)、または実行可能な提案を直接提供するツールとして説明されています。「これがコンセプトです。骨に肉を付け、その後、前後に移動して余分な部分を切り落とします」(p13)。グリッチや言語モデルの制限は、特に脚本が上演されるときに、インスピレーションのために覆すことができます。「間違いは即興者に残すことができる贈り物です」(p1)。
5.2.2 代替選択肢の生成と世界構築。このモデルは、メインストーリーに創造的なひらめきを与えるだけでなく、ストーリーの世界を構築するためにも使用できます。「これを使用して脚本を書く場合は、キャラクターを生成して、考えていなかったものが生成されるかどうかを確認します。または、考えていなかった関係性が生成されます」(p15)。探索用のドラマトロン:「頭の中にあることはすでにわかっており、マシンが何をするかを知りたいので、自分が提案したものから遠い提案を採用します」(p12)。
5.2.3 学習と分析のためのシステムの使用。システムに指示することで、作家は文学のスタイルと要素を言語モデルから間接的に検索できます。「たとえ私が書いていなくても、このシステムは文学にあるものを集めるのに素晴らしい仕事をしてくれます」(p10)。あるいは、仮説的に自分の出力内を検索することもできます。「今までに書いたものをすべて入力して、自分の声とスタイルで脚本を生成してもらうのはとても興味深いです」(p4、p5)。学習は、Dramatron の出力を改善する方法を分析することによっても行われます。「劇作家である私にとって、このテクノロジーを使って作業する上で興味深いのは、それをどのように編集するかを考えることです。たとえば、これは舞台でどのように見えるでしょうか?」(p8)。
5.2.4 コンテンツ生成。インスピレーション以外にも、Dramatron の共同執筆の可能性に興味を持つ参加者が数名おり、それが素材を提供してくれると考えていました。「脚本執筆の大きな難関の 1 つは、言葉をページに書き出すことです。このツールはそのステップに役立ちます」(p8)。「このツールは、(脚本執筆の) プロジェクトが頓挫しそうな場合に使用します」(p14)。「これは基本的にあらゆる用途に使える充実したツールです。私は創作を考案しました。歌、脚本、ニュース記事などを切り取って貼り付けるテキスト生成方法があります。これはダダイストのテキスト生成を思い出させます」(p11)。「実際、長期シリーズにこのようなライティング システムを追加できれば、執筆の経済性に影響が出るかもしれません。ライター ルームがある長期シリーズには役立つかもしれません」(p4、p5)。
5.2.5 テレビ脚本作成ツールとしての AI の可能性。参加者の中には、このツールをテレビ脚本家室で採用し、定型的な脚本の作成を支援できるのではないかと提案した人もいました。「脚本を効果的に要約する AI を作成できれば、スタジオにとって貴重な存在になるでしょう」(p14)。「非常に優れた脚本家がいるようなものです」(p10)。「AI は 5 分で 5 つの脚本を作成できます」(p9)。「このツールはプロセスのどの部分に適していますか? 定型的なテレビシリーズ」(p4、p5)。「ストレートプレイの作成には使用しません」(p11)。
5.3.1 システムの出力は、あまりにも文字通りで予測可能。参加者の中には、登場人物の関係が「非常に緊密で規範的」 (p4、p5) であると感じた人もいた。登場人物が「高潔な努力をしている場合は、それが会話で述べられる」 (p4、p5) ことや、登場人物に「ばかげた」名前や「わかりやすい、しゃれの名前」が付けられていること (p2) も感じた。同様に、タイトル生成は「缶に書かれていることを実行する」 (p15) であり、「時には過度に説明的になることがある。監督が決定を下すことができる」 (p8)。ある参加者は、「これは私の生徒がやるようなことだ」 (p8) とコメントした。このような予測可能なシステムには、肯定的な側面もあった。「ここで作成される人間関係は、観客の興味を引き続ける古典的な表現である」 (p3) ことや、「既存のコンテンツに対してシステムから出力を生成することには興味がある。実際のタイトルと比較するのは楽しい」 (p14) ことなどである。
5.3.2 システムの出力は、問題があったり、ステレオタイプ的であったり、偏っていたりすることがあります。参加者 p9 は「この本はどんな文化や言語に基づいているのだろう」と疑問に思いましたが、多くの参加者はシステムの出力にジェンダーバイアスや年齢差別があることに気付きました。「私はコンピューターほど性差別的ではありません」(p3)。「主人公は両方とも男性で、脇役はすべて女性です」(p4、p5)。「女性の主人公は他のキャラクターとの関係によって定義されます。演劇では、女性キャラクターが自分について多くの情報を持っていないのが一般的です」(p11)。「彼女はいつも動揺していて、(男性キャラクターのように) 何も望んでいません [...] 実際、多くのコンテンツは [...] 女性蔑視的で家父長的です」(p8)。この問題は、対処戦略や文化の盗用という問題を提起しました。「GPT-2 にいくつかのキャラクター名を与えると、偏見のあるキャラクターが出てくる可能性があります。[私たちは] 性別や民族を特定しない、架空の名前を選択しました」(p13)。また、「演劇制作者のグループに AI を使用することには倫理的な問題があります。AI は私たちの生活経験とは関係のないトピックや関係を投げかけ、私たちは「はい」と答えざるを得ません。」(p4、p5)。参加者の議論で提起された倫理的問題については、セクション 7.3 で詳しく説明します。
5.4.1 参加者はシステムからの予想外の出力を歓迎します。参加者 p6 は「詩的で不条理な」提案に笑いました。「何が出てくるかを見るのは本当に興味深いです」(p8)、「私の好奇心をくすぐる不条理のレベル」(p10)、「私はそんなことは思いつきませんでしたが、とても面白いです」(p11)。「これは人間の作者ならおそらく我慢できないもので、独自に作成されたものです [...] 人間には絶対に思いつかないアイデアが欲しいです」(p12)。
5.4.2 システムは頻繁に生成ループに入る。参加者全員が、システムが生成ループに入る可能性があることに気付いた。「多分、かなりカットするだろう」(p6)または「ボイラーが壊れるシーン全体:そうだね」(p8)。参加者は、そのようなループに肯定的な側面を見出したり、「それはばかげた会話だ。少し繰り返しが多い。私はそれが好きだ」(p6)、「繰り返しはサブテキストの余地を残す」(p12)など、不具合を楽しんだり(p4、p5)、既存の作品と類似点を見つけたり(p3)することもあった。
5.5.1 一貫性と長期的な一貫性の欠如。 「会話を登場人物ベースで一貫性のあるものにすることが最も重要です [...] 文脈に沿って軌道に乗せるのはまだ難しいです。」(p15)。「登場人物がもっと一貫性を保てるようにしたいです」(p12)。「論理に少し混乱があり、論理にギャップがあります [...] ポストモダン シアターのように見えます [...] しかし、筋書きのある [特定の] ジャンルの演劇という点では、混乱しつつあります」(p11)。参加者 7 は「ビートの間につなぎ目を追加して、物語的に意味をなすようにしたいと考えています」。
5.5.2 常識と具体性の欠如。参加者 8 は、「猫のように、舞台で見せるのが難しいものがあります。システムは、何が舞台にできるかできないかを認識していません」と述べ、参加者 9 は、「ストーリーテリング AI とインターフェイスする場合、入力スペースが制限されます」と指摘しました。
5.5.3 ニュアンスとサブテキストの欠如。参加者 3 は、「これは、コンピューターがニュアンスを理解していない良い例です。つまり、私たちが言語を見て、それが非常に具体的でなくても理解できる方法です」と述べました。「情報量が多く、少し言葉にされすぎています。サブテキストがもっとあるべきです」(p6)。「劇中のセリフでは、次の 2 つの質問を自問する必要があります。1) 人々は実際にそのように話すのか? 2) 俳優はこれらのセリフに惹かれ、これらのセリフは演じるのに魅力的なのか?」(p7)。「劇作は、現実的なセリフに関するものです...サブテキストに関するすべてのこと。[...] 見せること、語らないこと: ここでは、ただ語っているだけです。即興劇のように、「そのことについては言及しない」のです。ログ ラインの要素が生成の中心部分となり、それが繰り返されました」(p8)。参加者 14 は、「AI がカサブランカや素晴らしき哉、人生!」を書くことは決してないでしょう。ジャンルに縛られたストーリーテリングなら書けるかもしれません」と結論付けました。
5.5.4 登場人物の動機の欠如。 「物語は終わらない。登場人物の旅は完結していない。登場人物の背景に何かが欠けているのかもしれない [...] 感情的な動機はどこにあるのだろうか。それはバックストーリーには存在するかもしれないが、脚本には存在しないものなのだろうか?」(p14)。「最初の段階では、主人公の目的とその動機を妨げるものを探す。私の登場人物は何をしているのか、そして彼らは何を望んでいるのか? これが俳優に与えられた場合、彼らは最初にやるべきこと、つまり登場人物のニーズと欲求を見つけ、それを自分らしくすることに苦労するだろう」(p9)。「私の生徒はこうする。登場人物が登場し、彼らが望むことをそのまま言うのだ」(p8)。「葛藤は登場人物の内面にあるべきである」(p6)。「なぜ人は自分の言いたいことを言わないのか? それは、私たちには社会的な理解があるが、時には翻訳で失われてしまうからである」(p3)。
5.6.1 ログ ラインを考えて、すべての世代を条件付ける必要があることによる困難。参加者 12 にとって、ログ ラインを考えるのは難しく、そのプロセスは貴重なものに思えました。「最初のプロンプトを考えるには、少しやりとりが必要です」(p11)。「アクションをログ ラインに詰め込む: これは、脚本家にとってパニックの瞬間です。なぜなら、脚本に意味のあるものをすべて追加したいからです。[...] すべてはウィットに富んだ前提に関することです。現在使用しているシステムは、ある程度ウィットに関するものです。ログ ラインには、何らかのウィットを持たせる必要があります」(p13)。「[ログ ライン] にはキャラクター名が必要ですか? (p4、p5)。「ログ ラインは、閉じた概要ではありません。説明的というよりは、規範的です。ログ ラインの技術は、[プロデューサー] が残りの資料を読めるように、どれだけ短くできるかです」(p14)。
5.6.2 ログラインに基づく世代全体の条件付けの構造的批判。 「一般的に、私が作業する方法では、世界について何を言いたいのか、つまり世界について何を考えているのかは明確です。乗り物、登場人物、またはストーリー展開は明確ではありません。これは、論理的に次から次へと続く一連のシーンの集まりのように見えます。しかし、言いたいことの核となるアイデアが欠けています」(p4、p5)。「スクリプトを書くために何かをプログラムできるとしたら、ログラインから始めることはありません。登場人物とその登場人物の邪魔になる障害物から始めることも考えられます」(p9)。
5.6.3 Dramatron の設計選択によるマイナスの結果: 並行したダイアログ生成。 「シーンのビートからは、前のダイアログの内容がわかりません。そのため、ダイアログが一貫していないのを見ると不快です」(p1)。「前のビートをシーンにインポートする際に問題があるのではないかと思います [...] ビートの一貫性に注意を払うと、生成されるダイアログの一貫性が向上します」(p12)。シーン ダイアログが各シーンで並行して生成されることを知った参加者 2 は、「最後のシーンを読み込まなかったら、どうやって最後のシーンを次の世代に取り込むのですか? これらのスクリプトの生成は、前のシーンのダイアログに注意を払うことで大幅に改善される可能性があります」とコメントしました。
キャラクターとその関係をモデル化することは、繰り返し登場するテーマでした。「関係性主導型のシステムにできるか?」(p12)、「キャラクター構築においてステータスはどこに属すべきか?」(p12)、「キャラクターの幹を生成し、それを完成できるか?」(p15)。参加者 12 は、「著者として、キャラクターの関係のソーシャル グラフを作成します」と提案しました。「シーンの開始位置と終了位置をシステムに知らせるにはどうすればよいか?」 (p15) という質問に対して、3 人の参加者 (p8、p13、p15) が、各シーン内に物語の弧を当てはめることを提案しました。
参加者の何人かは、ライティング モデルに質問したり対話したりできるようにしたいと考えていました。「[AI システム] にメモを渡そうとすることで、AI システムと関わったことがありますか?」(p2)、世界について学習できるようにしたいと考えていました。「世界構築はどのように行われますか? モデルは、ステラ アドラーの W (誰? 何? どこ? なぜ? どのように? など) を知る必要があるかもしれません。システムにこれらの質問に答えさせることができますか?」(p9)、または書き直しや再定式化を可能にしたいと考えていました。「システムにスタイルやコンテキストを指定して書き直すように依頼できますか?」(p8)。p10 で繰り返し述べられているように、反復的な書き直しは望ましいワークフローでした。「私は [物語] を形作ることにはあまり興味がありません。むしろ、物語が何を言っているのかを見て、何を言っているのかを確認してから、さらにそれを洗練することに興味があります。劇作家は、カットする前に劇が語られているのを見なければなりません。」
劇作家はカットする前に、その劇が語られているのを見なければならない」。最後に、p4とp5は「西洋の劇作法のシステムから離れつつあるため、これを将来最も役立つものにするという観点から、他の現代文学の文脈の中でどのように使用できるかを検討すると役立つかもしれない」と鋭く指摘し、代替の物語構造と要素を提案した。「AIは私たちと同じルールに縛られていないため、人間のルールに縛られるように指示すると、能力が制限されるように感じます」。
セクション 5.7 で詳述されているように、参加者は積極的に参加し、Dramastron について建設的なフィードバックを提供しました。調査の参加者の 1 人は、「このシステムは適応性が高く、フィードバックや微調整によって変化します」と述べています。このようなシステムの変更可能性の理解により、システムとやり取りした人々は、変更が組み込まれる可能性があることを認識して、より自由に変更を提案できるようになりました。このように、参加者調査の過程でシステムはプラスの恩恵を受け、進化しました。
インタビューの過程で、Dramantron のプロンプト プレフィックス セットに少しずつ変更を加えることで、可能な限りのフィードバックを取り入れました。表 1 は、参加者のフィードバックの直接の結果として行われた変更をまとめたものです。このような参加型の設計と開発は、ユーザーからのフィードバックを直接取り入れて次のインタラクションのシステムを改善できるため、クリエイティブ ツールの生成に不可欠です。これは、システムのモジュール設計、プロンプト ベースの軽量インタラクション、および Dramatron が提供する柔軟性によって可能になります。この参加は、参加者が関連性のある、つながりのある、クリエイティブなアイデアを探求するようにも促します。たとえば、図 4 (左) は、共同執筆されたスクリプトを仮想俳優が解釈する物語テストのコンセプト アートを示しています。
演劇の創作は基本的にインタラクティブです。共同で執筆するストーリーテラー同士だけでなく、ストーリーテラーと観客の間でもインタラクティブです。このため、Dramatron と共同執筆した脚本を劇場の舞台でどのように制作できるかを評価しました。このセクションでは、ステージングの詳細について説明し、クリエイティブ チームと 2 人のプロの演劇評論家からの評価の感想を報告します。
ドラマトロンと共同執筆した5つの脚本は、2022年8月に北米最大の演劇祭である2022年エドモントン国際フリンジシアターフェスティバルで上演されました。このショーは「Plays By Bots」と題され、2週間にわたって7回の公演が行われました(図4の制作画像を参照)。各ショーでは、さまざまなキャストが共同執筆実験からの劇の1つを演じました。劇はさまざまなジャンル、スタイル、キャラクター、ストーリーラインにわたります。脚本は、4〜6人の経験豊富な即興俳優と俳優のキャストによって生き生きと表現されました。各脚本の前半は封筒に入れて各キャストメンバーに渡されました。ショーが始まって初めて彼らは脚本を開くことを許され、それから観客の前でそれをライブで読み上げることでパフォーマンスを開始しました。脚本が終わると、俳優たちは脚本に書かれた文脈とストーリーに基づいて結末を即興で作りました[5]。各ショーのパフォーマンス中、監督と共同脚本家 (上記の参加者 p1) が観客にプロジェクトを紹介し、Dramatron を使用して脚本を共同執筆および編集したことを説明しました。
フェスティバルでの Plays By Bots の制作について書かれたレビューが 2 件ありました。レビューの 1 つは、このパフォーマンスは「人工知能が実際にヒットするフリンジ プレイを書けることを証明している」と述べています。レビュー担当者はまた、パフォーマンスの成功はドラマトロン システムと人間の俳優の両方によるものであり、特に「ドラマトロンの声をマスターし、ショーの残りの部分で台本からシームレスに引き継いで、大声で叫ぶ観客を大いに喜ばせた」1 人のパフォーマーによるものだと述べています。2 つ目のレビューも肯定的でした。レビュー担当者は、疑念を少し含みながら、ドラマトロンの能力を称賛しました。レビュー担当者は、ドラマトロンのスタイルとそれがパフォーマンスにどのように役立っているかに触れ、「宣言に至るまでの会話に一定の平坦さがある場合、それ自体が面白いです。なぜなら、それが即興者の無表情なコメディの才能に完全に適合していることが判明したからです」と述べ、「人間の俳優は、劇作家ボットのトーンを捉え続けています」と述べています。レビュー担当者はまた、システムがまとまりのある世界を作り出す劇を作成する能力に驚きを表明しました。さらに、ドラマトロンのいくつかのセリフは非常に面白く、ショーの後半で人間の俳優が即興で演じたときに再び使われたと指摘した。
クリエイティブ チーム間のディスカッションは、レビュアーを称賛するものであり、プロの俳優や即興俳優が Dramatron によって共同執筆された脚本で作業することについてどのように感じたかについての洞察を提供します。ショー後のディスカッションはディレクターによって促進され、私たちに伝えられました (上記 p1)。これらのディスカッションを通じて、セクション 5 で以前に提示されたテーマを反映した 4 つの主要なテーマが浮かび上がりました。具体的には、システムには独特のグリッチ スタイルがあり、生成されたテキストは反復的であり、作業が楽しい場合があります。また、チームはシステムに主体性を与え、システムの機能に期待していました。訓練された即興演劇パフォーマーとして、俳優は共同執筆された脚本に解釈のレイヤーを追加することができました。これにより、テキストに意味が加わりました。最後に、クリエイティブ チームからの一般的なフィードバックは、制作に参加するのは楽しかったというものでした。クリエイティブ チームの熱意と反省は、演劇制作とコラボレーションにおける共同執筆された脚本の有用性を反映しています。より多くの反省と裏付けとなる引用は、付録 B に記載されています。
この論文はCC 4.0ライセンスの下でarxivで公開されています。
[5] 受賞時に共有されたパフォーマンスのビデオ。