Yazarlar:  (1) Prerak Gandhi, Bilgisayar Bilimi ve Mühendisliği Bölümü, Hindistan Teknoloji Enstitüsü Bombay, Mumbai, prerakgandhi@cse.iitb.ac.in ve bu yazarlar bu çalışmaya eşit katkıda bulunmuştur;  (2) Vishal Pramanik, Bilgisayar Bilimi ve Mühendisliği Bölümü, Hindistan Teknoloji Enstitüsü Bombay, Mumbai, vishalpramanik,pb@cse.iitb.ac.in ve bu yazarlar bu çalışmaya eşit katkıda bulunmuşlardır;  (3) Pushpak Bhattacharyya, Bilgisayar Bilimi ve Mühendisliği Bölümü, Hindistan Teknoloji Enstitüsü Bombay, Mumbai.  Bağlantı Tablosu   Özet ve Giriş   Motivasyon   Alakalı iş   Veri kümesi   Deneyler ve Değerlendirme   Sonuçlar ve Analiz   Sonuç ve gelecek iş   Sınırlamalar ve Referanslar   A. Ek  4. Veri Kümesi  Filmin olay örgüsünü oluşturmak için olay örgüsünü Wikipedia'dan aldık. Bu göreve ilişkin istemler IMDb'den alınmıştır. IMDb'de bu istem iki türde olabilir. Birincisi filmin kısa bir açıklamasıdır (15-40 kelime), ikincisi ise 30-200 kelime arasında değişen ve filmin farklı karakterleri ve olayları hakkında çok daha fazla ayrıntı içeren uzun bir hikayedir. Ayrıca her filmin türünü IMDb'den topladık. Daha sonra olay örgüsünü 4 perdelik bir yapı kullanarak bölüyoruz. Sahne oluşturmak için IMSDb'den komut dosyalarını alırız ve bunlara bir sahnenin temel öğelerini ekleriz.  4.1. Grafik Oluşturma Veri Kümesi  Python'daki wikipedia modülünü kullanarak Wikipedia'dan çıkarılan, hem Bollywood hem de Hollywood olay örgülerinden oluşan 1000 olay örgüsünden oluşan bir veri kümesi oluşturduk. Toplanan konuların uzunluğu ortalama 700 kelime civarındadır.  4.1.1. Ek Açıklama Yönergeleri  Ek A.5'te açıklanan 4 perdeli yapıyı kullanarak grafikleri manuel olarak 4 parçaya bölerek açıklama ekliyoruz. Her perdenin sonuna tek bir etiket yerleştiririz: 〈bir〉 (Perde 1), 〈iki-a〉 (Perde 2 Kısım A), 〈iki-b〉 (Perde 2 Kısım B) ve 〈üç〉 (Perde 3) ) sınırlayıcılar olarak. Ekte çizim açıklamasına ilişkin bir örnek verilmiştir (Şekil 6).   4.1.2. Film Türleri  Model tarafından oluşturulan olay örgüsüne bir miktar kontrol edilebilirlik kazandırmak için, hikayeyle birlikte veri setindeki filmlerin türlerini de tanıttık. Türleri hikayenin başında birleştiriyoruz. Şekil 2 veri setindeki türlerin dağılımlarını göstermektedir.  4.2. Sahne Oluşturma Veri Kümesi  Film senaryoları çok uzun. 2 saatlik bir film yaklaşık 30.000 kelimeye karşılık gelmektedir. Yaratıcı metin oluşturmak için kullanılan GPT-2 ve GPT-3 gibi dil modellerinin jeton sınırları sırasıyla 1024 ve 2048'dir ve bu da bir komut dosyasının tamamının tek seferde işlenmesini imkansız hale getirir. Bu nedenle senaryoları sahnelere ayırıp kısa açıklamalarını manuel olarak oluşturduk. Bu, önceki sahnelere güvenmek yerine sahnelerin bağımsız olarak eğitilmesine olanak tanır.  Film senaryoları Ek A.4'te açıklanan birden fazla öğeden oluşur. Farklı öğeler, modellerin her bir öğeyi ayırt etmeyi öğrenmede karşılaştığı zorluğu artırır. Bu engelin üstesinden gelmek için senaryo boyunca dört ana unsuru etiketliyoruz:  kısa cümleler, aksiyon satırları, diyaloglar ve karakter adları.  4.2.1. Ek Açıklama Yönergeleri  Her senaryoda mevcut olan dört ana öğeyi (   ) koruyoruz ve sayfa numarası, geçişler veya sahne tarihleri gibi diğer her türlü bilgiyi kaldırıyoruz. Dört ana öğenin etiketlenmesi, aşağıda gösterildiği gibi öğelerin etrafına sarılmış başlangıç ve bitiş etiketleri kullanılarak yapılır: sözlü açıklamalar, aksiyon satırları, karakter adı ve diyaloglar  • Sümüklü çizgiler: 〈bsl〉...〈esl〉  • Eylem Hatları: 〈bal〉...〈eal〉  • Karakter Adı: 〈bcn〉...〈ecn〉  • Diyalog:〈bd〉...〈ed〉   Açıklamalı bir sahne örneği Şekil 3'te görülmektedir.  Bu makale   . arxiv'de CC 4.0 DEED lisansı altında mevcuttur

Part of HackerNoon's growing list of open-source research papers, promoting free access to academic material.

Teleplay.Tech

From teleplay to technology, we weave a narrative tapestry that dances between writing, CGI, and action.

Teleplay's blog

Bu ses hikayenin orijinal dilinde üretilmiştir!

"Kurosawa": Bir Senaryo Yazarının Asistanı: Veri Kümesi

About Author

YORUMLAR

ETİKETLERİ ASIN

BU YAZI

Related Stories

Claude Sonnet 3.5 Sistem Bilgi Sızıntısı: Adli Analiz

Kripto Büyümesi: Etkili Kullanıcı Kişilikleri Oluşturma

Bu 18 Geliştirici Aracıyla Üretkenliğinizi Artırın 🚀🔥

Telegram: Kripto Adası'nın anakaraya olan köprüsü

Claude Sonnet 3.5 Sistem Bilgi Sızıntısı: Adli Analiz

Kripto Büyümesi: Etkili Kullanıcı Kişilikleri Oluşturma

Bu 18 Geliştirici Aracıyla Üretkenliğinizi Artırın 🚀🔥

Telegram: Kripto Adası'nın anakaraya olan köprüsü

Light-Mode

Classic

Newspaper

Minty

Dark-Mode

Neon Noir

Minty

HN StartUps