paint-brush
"Kurosawa": Bir Senaryo Yazarının Asistanı: Ekile@teleplay
149 okumalar

"Kurosawa": Bir Senaryo Yazarının Asistanı: Ek

ile Teleplay Technology 5m2024/05/23
Read on Terminal Reader

Çok uzun; Okumak

Bu makalede araştırmacılar, eğlence medyasındaki otomasyonu ele alan olay örgüsü ve senaryo oluşturmaya yönelik bir yapay zeka senaryo yazma tezgahı olan KUROSAWA'yı tanıtıyor.
featured image - "Kurosawa": Bir Senaryo Yazarının Asistanı: Ek
Teleplay Technology  HackerNoon profile picture
0-item

Yazarlar:

(1) Prerak Gandhi, Bilgisayar Bilimi ve Mühendisliği Bölümü, Hindistan Teknoloji Enstitüsü Bombay, Mumbai, [email protected] ve bu yazarlar bu çalışmaya eşit katkıda bulunmuştur;

(2) Vishal Pramanik, Bilgisayar Bilimi ve Mühendisliği Bölümü, Hindistan Teknoloji Enstitüsü Bombay, Mumbai, vishalpramanik,[email protected] ve bu yazarlar bu çalışmaya eşit katkıda bulunmuşlardır;

(3) Pushpak Bhattacharyya, Bilgisayar Bilimi ve Mühendisliği Bölümü, Hindistan Teknoloji Enstitüsü Bombay, Mumbai.

Bağlantı Tablosu

A. Ek

A.1. Etik Değerler

Tüm scriptleri IMDB ve IMSDb veritabanlarından aldık. Web sitesinde, komut dosyalarının araştırma amacıyla kullanılmasına ilişkin bir sorumluluk reddi beyanı bulunmaktadır; buna https://imsdb.com/disclaimer.html bağlantısından ulaşabilirsiniz. Komut dosyalarını adil bir şekilde ve telif hakkı ihlali olmadan kullandık.

A.2. Ek Açıklama Profilleri

İki durumda harici açıklayıcıların yardımına ihtiyaç duyduk: (i) Komut Dosyalarına Manuel Olarak Açıklama Ekleme ve (ii) Komut dosyalarından sahneler ve bunların açıklamalarını oluşturma. İlk görev için 10 yorumcunun yardımını aldık. Yaşları 21-28 arasında değişiyordu ve hepsi Asyalıydı. Açıklama ekleme örnekleriyle birlikte ayrıntılı yönergeler verildi. Anlayışlarını doğrulamak ve şüphelerini ve hatalarını çözmek için periyodik oturumlar da yapıldı. İkinci görev için iki açıklayıcının yardımını aldık. İkisi de 21-23 yaş arası Asyalı kadınlar. Her ikisine de sahne yazma görevi için ayrıntılı talimatlar verildi. Kavramsal hataları bulup düzeltmek için birkaç veri noktası rastgele seçildi ve kontrol edildi. Yorumcuların STEM ve Sanat alanında lisans ve yüksek lisans dereceleri vardı.

A.3. Değerlendirme Metrikleri

Değerlendirme metrikleri aşağıda açıklanmıştır:


• Şaşkınlık (PPL): Şaşkınlık, dil modellerini değerlendirmek için en yaygın ölçümlerden biridir. Entropinin üstel değeri olarak hesaplanırlar. PPL'nin değeri ne kadar küçük olursa, oluşturulan metnin akıcılığı da o kadar yüksek olur.


• BLEU: İki Dilli Değerlendirme Alt Çalışması , özellikle Makine Çevirisi alanında olmak üzere birçok NLP görevinde ortak bir ölçümdür. Üretilen çıktı ile altın standart verileri arasındaki örtüşmeyi ölçer. Bu metrik modelin yaratıcılığını dikkate almasa da aday metin ile referans metin arasındaki farkı BLEU kullanarak çıkarabiliyoruz. BLEU ölçüsü ne kadar yüksek olursa o kadar iyidir.


• ROUGE: Temel Değerlendirme için Hatırlamaya Yönelik Alt Çalışma , genellikle otomatik özetlemeyi değerlendirmek için kullanılır. Bizim durumumuzda, oluşturulan ve orijinal grafikler arasındaki en uzun örtüşen diziyi ölçer. ROUGE ölçüsü ne kadar yüksek olursa o kadar iyidir.


• N-gram: Tekrar ve ayrım n-gram puanlarını hesaplayarak film olay örgüsünün fazlalığını ve çeşitliliğini ölçeriz.

A.4. Senaryo Yapısı

Bir film senaryosu veya senaryo, hikayeden farklı bir formata sahiptir. Senaryo bir grup sahneden oluşur. Bu sahnelerin her biri aşağıda tartışılan birkaç ana bileşenden oluşur:


Sahne Başlıkları/Sümüklü Hatlar- Bu bileşen, sahnenin ne zaman ve nerede olduğunu açıklar. Bir kameranın yeni bir sahneyi çektiği ilk kare olarak düşünülebilir. Örneğin INT. - RESTAURANT - GECE, sahnenin gece bir restoranın içinde başladığını belirtir. Sümüklü çizgiler normalde büyük harflerle yazılır ve sola hizalanır.


Karakter İsimleri - bir karakter diyalog kurarken her seferinde bunlardan bahsedilir. Her karakterin adı büyük harfle belirtilir ve ortaya hizalanır.


Diyaloglar - diyaloglar karakterlerin söylediği satırlardır. Bir komut dosyasındaki karakter adından hemen sonra görünürler ve merkezi olarak hizalanırlar.


Aksiyon Çizgileri - aksiyon çizgileri bir sahneyle ilgili hemen hemen her şeyi açıklar. Her senaryonun anlatımı olarak tanımlanabilirler. Eylem satırları diyaloglardan veya kısa açıklamalardan sonra mevcut olabilir ve sola hizalanır.


Geçişler - geçiş, bir sahneden diğerine geçişi işaret eder. Ayrıca bir sahnenin nasıl bittiğini de tasvir ediyorlar. Örneğin, DISSOLVE, FADE ve CUT bir geçişi belirtmek için kullanılan farklı anahtar sözcüklerdir. Genellikle büyük harfle yazılırlar ve sağa hizalanırlar.


Şekil 8 senaryo elemanlarının bir örneğini göstermektedir.

A.5. Hikaye Şablonları

Zamanla hikaye oluşturmaya yardımcı olan çeşitli şablonlar geliştirildi. En ünlü şablonlardan biri 3 perdelik yapıdır (Field, 1979). Bu yapı, hikayeyi kurulum, yüzleşme ve çözüme böler. Bu çalışmamızda şimdi detaylı olarak anlattığımız 4 perdeli yapıyı kullandık.


Perde 1 - Bu açılış/giriş perdesidir. Baş kahramanın karakterini anlatır ve filmin temasını kısaca tanıtır. Oyun, kahramanın yeni bir yolculuğunun başlamasıyla sona erer.


Perde 2A - Perde 2'nin geniş kapsamı nedeniyle iki perdeye ayrılabilir. Bu eylem genellikle bir aşk hikayesinin başlangıcını içerir. Kahramanın yeni yolculuğuna uyum sağlamaya çalışması izleyiciyi de eğlendiriyor. Perde, filmin kritik anlarından biri olan orta noktası olarak, çok olumlu ya da olumsuz bir sahneyle sona eriyor.


Perde 2B - Bu hareket genellikle kahramanın düşüşünü içerir. Kötü adam ya da düşman bir avantaj elde etmeye başlar ve kahraman önemli bir şeyi ya da birini kaybeder. Oyun, kahramanın dibe vurduktan sonra yeni görevini gerçekleştirmesiyle sona erer.


Perde 3 — Kahraman, kendisinde gerekli olan değişikliğin farkına varır ve heyecan verici bir finalde rakibini yenmek için yola çıkar. Film daha sonra baş karakterde başlangıçta eksik olan hoş bir değişikliği sergileyerek sona erer.


Şekil 6: Kalbin Müziği filminin olay örgüsüne 4 perdelik yapı kullanılarak manuel açıklama örneği

A.6. GPT-3'ün İnce Ayarı

GPT-3, geçen yıl OpenAI tarafından halka açık olarak kabul edildi (Brown ve diğerleri, 2020). En iyi modeli, GPT2'nin 2.9B parametrelerinden çok daha fazla olan 175B parametresine sahiptir. Bir sahne oluşturma modelinin yanı sıra GPT-3 ile çoklu olay örgüsü oluşturma modellerine ince ayar yaptık. Olay örgüsü oluşturma modellerinin çoklu kombinasyonları, kısa veya uzun istemlerdir ve türler olsun veya olmasın. GPT-3 modeli ve hiperparametreler yukarıdaki tüm kombinasyonlar için aynı kalır. GPT-3 Curie modeline dört dönem için ince ayar yaptık. Metin oluşturmak için GPT-3, istediğimiz sonuçları ayarlamak ve bunlara yaklaşmak için çeşitli hiper parametreler sunar. Test için diğer hiperparametreleri şu şekilde ayarladık: sıcaklık 0,7, üst p 1, frekans cezası 0,1, varlık cezası 0,1 ve maksimum jetonlar 900.


Şekil 7: Kısa bir girdi verildiğinde oluşturulan tam bir sahne örneği.


Şekil 8: Bir senaryonun unsurları