paint-brush
"कुरोसावा": एक पटकथा लेखक का सहायक: प्रयोग और मूल्यांकनद्वारा@teleplay

"कुरोसावा": एक पटकथा लेखक का सहायक: प्रयोग और मूल्यांकन

द्वारा Teleplay Technology 2m2024/05/23
Read on Terminal Reader

बहुत लंबा; पढ़ने के लिए

इस शोधपत्र में शोधकर्ताओं ने KUROSAWA का परिचय दिया है, जो कथानक और स्क्रिप्ट निर्माण के लिए एक AI स्क्रिप्ट-लेखन कार्यक्षेत्र है, जो मनोरंजन मीडिया में स्वचालन पर ध्यान केंद्रित करता है।
featured image - "कुरोसावा": एक पटकथा लेखक का सहायक: प्रयोग और मूल्यांकन
Teleplay Technology  HackerNoon profile picture
0-item

लेखक:

(1) प्रेरक गांधी, कंप्यूटर विज्ञान और इंजीनियरिंग विभाग, भारतीय प्रौद्योगिकी संस्थान बॉम्बे, मुंबई, [email protected], और इन लेखकों ने इस कार्य में समान रूप से योगदान दिया;

(2) विशाल प्रमाणिक, कंप्यूटर विज्ञान और इंजीनियरिंग विभाग, भारतीय प्रौद्योगिकी संस्थान बॉम्बे, मुंबई, vishalpramanik,[email protected], और इन लेखकों ने इस कार्य में समान रूप से योगदान दिया;

(3) पुष्पक भट्टाचार्य, कंप्यूटर विज्ञान और इंजीनियरिंग विभाग, भारतीय प्रौद्योगिकी संस्थान बॉम्बे, मुंबई।

लिंक की तालिका

5. प्रयोग और मूल्यांकन

हम अपने डेटासेट के साथ GPT3 को फाइन-ट्यून करते हैं ( परिशिष्ट A.6 देखें)।

5.1. प्लॉट निर्माण

हमने अपने मूवी प्लॉट डेटासेट के साथ GPT-3 को निम्नलिखित तरीके से फाइन-ट्यूनिंग करके 5 मॉडल बनाए हैं, (i) मूल (एनोटेशन के बिना) ( O ): इनपुट- लघु कथाएँ, आउटपुट- बिना किसी एनोटेशन के प्लॉट, (ii) एनोटेशन और लघु इनपुट (AS) : इनपुट- लघु कथाएँ, आउटपुट- 4-अधिनियम संरचना के साथ एनोटेट किए गए प्लॉट, (iii) एनोटेशन और लंबा इनपुट ( AL ): इनपुट लंबी, अधिक वर्णनात्मक कथाएँ, आउटपुट- 4-अधिनियम संरचना के साथ एनोटेट किए गए प्लॉट, (iv) एनोटेशन और लघु इनपुट जिसमें शैलियाँ शामिल हैं ( ASG ): इनपुट लघु कथाएँ और शैलियाँ, आउटपुट- 4-अधिनियम संरचना के साथ एनोटेट किए गए प्लॉट, (v) एनोटेशन और लंबा इनपुट जिसमें शैलियाँ शामिल हैं ( ALG ): इनपुट- शैली के साथ लंबी और अधिक वर्णनात्मक कथाएँ


स्वचालित मूल्यांकन के लिए हम BLEU (पापिनेनी एट अल., 2002), पेरप्लेक्सिटी (जेलिनेक एट अल., 1977), ROUGE (लिन, 2004) का प्रयोग करते हैं। हम पांच-बिंदु लिकर्ट स्केल (लिकर्ट, 1932) के रूप में मानव मूल्यांकन का भी उपयोग करते हैं। रेटिंग प्रणाली में 1-> पूरी तरह असहमत, 2-> असहमत, 3-> तटस्थ, 4-> सहमत, 5-> पूरी तरह सहमत हैं। मानव-लिखित कहानियों के लिए निम्नलिखित 5 विशेषताओं में से प्रत्येक के लिए 5 की रेटिंग मानी जाती है: (1) प्रवाह : व्याकरणिक शुद्धता; (2) सुसंगति : वाक्यों और अनुच्छेदों का तार्किक क्रम; (3) प्रासंगिकता : क्या प्रॉम्प्ट के मुख्य बिंदुओं को आउटपुट में हाइलाइट किया गया है; (4) पसंद : कहानी कितनी मनोरंजक है इसका माप;


प्लॉट बनाने के लिए, हम 50 टेस्ट प्रॉम्प्ट से 50 प्लॉट बनाते हैं। हम कहानियों को 10 के पाँच समूहों में विभाजित करते हैं और प्रत्येक समूह को तीन मूल्यांकनकर्ता सौंपते हैं।


दृश्य निर्माण के लिए, हम 10 परीक्षण संकेतों से दस दृश्य बनाते हैं। हम इन दस कहानियों को रेट करने के लिए पाँच मूल्यांकनकर्ताओं को नियुक्त करते हैं।


यह पेपर CC 4.0 DEED लाइसेंस के अंतर्गत arxiv पर उपलब्ध है।