paint-brush
"কুরোসাওয়া", একটি স্ক্রিপ্ট লেখকের সহকারী: বিমূর্ত এবং ভূমিকাদ্বারা@teleplay
418 পড়া
418 পড়া

"কুরোসাওয়া", একটি স্ক্রিপ্ট লেখকের সহকারী: বিমূর্ত এবং ভূমিকা

দ্বারা Teleplay Technology 5m2024/05/23
Read on Terminal Reader

অতিদীর্ঘ; পড়তে

এই গবেষণাপত্রে, গবেষকরা KUROSAWA, প্লট এবং স্ক্রিপ্ট জেনারেশনের জন্য একটি এআই স্ক্রিপ্ট-রাইটিং ওয়ার্কবেঞ্চ, বিনোদন মিডিয়াতে অটোমেশনকে সম্বোধন করে।
featured image - "কুরোসাওয়া", একটি স্ক্রিপ্ট লেখকের সহকারী: বিমূর্ত এবং ভূমিকা
Teleplay Technology  HackerNoon profile picture
0-item

লেখক:

(1) প্রেরক গান্ধী, কম্পিউটার সায়েন্স অ্যান্ড ইঞ্জিনিয়ারিং বিভাগ, ইন্ডিয়ান ইনস্টিটিউট অফ টেকনোলজি বোম্বে, মুম্বাই, [email protected], এবং এই লেখকরা এই কাজে সমানভাবে অবদান রেখেছেন;

(2) বিশাল প্রামানিক, কম্পিউটার সায়েন্স অ্যান্ড ইঞ্জিনিয়ারিং বিভাগ, ইন্ডিয়ান ইনস্টিটিউট অফ টেকনোলজি বোম্বে, মুম্বাই, vishalpramanik,[email protected], এবং এই লেখকরা এই কাজে সমানভাবে অবদান রেখেছেন;

(3) পুষ্পক ভট্টাচার্য, কম্পিউটার সায়েন্স অ্যান্ড ইঞ্জিনিয়ারিং বিভাগ, ইন্ডিয়ান ইনস্টিটিউট অফ টেকনোলজি বোম্বে, মুম্বাই।

লিঙ্কের টেবিল

বিমূর্ত

গল্প বলা হল বিনোদন শিল্পের লাইফলাইন- সিনেমা, টিভি শো এবং স্ট্যান্ড-আপ কমেডি, সকলেরই গল্পের প্রয়োজন। একটি ভাল এবং আকর্ষক স্ক্রিপ্ট গল্প বলার লাইফলাইন এবং সৃজনশীলতা এবং সম্পদ বিনিয়োগের দাবি করে। ভাল স্ক্রিপ্টরাইটার খুঁজে পাওয়া বিরল এবং প্রায়ই গুরুতর সময়ের চাপের মধ্যে কাজ করে। ফলস্বরূপ, বিনোদন মিডিয়া সক্রিয়ভাবে অটোমেশন খুঁজছেন. এই কাগজে, আমরা KUROSAWA নামে একটি AI-ভিত্তিক স্ক্রিপ্ট-রাইটিং ওয়ার্কবেঞ্চ উপস্থাপন করি যা প্লট জেনারেশন এবং স্ক্রিপ্ট জেনারেশনের কাজগুলিকে সম্বোধন করে। প্লট জেনারেশনের লক্ষ্য একটি সুসংগত এবং সৃজনশীল প্লট (600-800 শব্দ) একটি প্রম্পট দেওয়া (15-40 শব্দ) তৈরি করা। অন্যদিকে, স্ক্রিপ্ট জেনারেশন একটি সংক্ষিপ্ত বিবরণ (15-40 শব্দ) থেকে একটি চিত্রনাট্য বিন্যাসে একটি দৃশ্য (200-500 শব্দ) তৈরি করে। কুরোসাওয়াকে প্রশিক্ষণের জন্য ডেটা প্রয়োজন। প্লট ডেটাসেট ম্যানুয়ালি টীকা করতে আমরা গল্প বলার 4-অভিনয় কাঠামো ব্যবহার করি। আমরা 1000টি ম্যানুয়ালি টীকা করা প্লট এবং তাদের সংশ্লিষ্ট প্রম্পট/স্টোরিলাইনগুলির একটি ডেটাসেট তৈরি করি এবং চারটি প্রধান উপাদান সহ 1000টি দৃশ্যের একটি সোনার-মান ডেটাসেট তৈরি করি — দৃশ্যের শিরোনাম, অ্যাকশন লাইন, সংলাপ এবং চরিত্রের নাম — পৃথকভাবে ট্যাগ করা হয়েছে৷ আমরা প্লট এবং দৃশ্য তৈরি করতে উপরের ডেটাসেটগুলির সাথে GPT-3 সূক্ষ্ম-টিউন করি। এই প্লট এবং দৃশ্যগুলি প্রথমে মূল্যায়ন করা হয় এবং তারপর একটি বৃহৎ এবং বিখ্যাত মিডিয়া প্ল্যাটফর্ম ErosNow[1]-এর স্ক্রিপ্টরাইটাররা ব্যবহার করেন। আমরা স্বয়ংক্রিয় মুভি প্লট এবং স্ক্রিপ্ট তৈরির জন্য একটি কার্যকরী বেঞ্চমার্ক হিসাবে এই ডেটাসেটগুলিতে প্রশিক্ষিত টীকাযুক্ত ডেটাসেট এবং মডেলগুলি প্রকাশ করি।

1। পরিচিতি

চলচ্চিত্র বিশ্বব্যাপী মানুষের জন্য বিনোদনের অন্যতম জনপ্রিয় উৎস এবং শিক্ষা ও সামাজিক সচেতনতার একটি শক্তিশালী মাধ্যম হতে পারে। ফিল্ম ইন্ডাস্ট্রিগুলির প্রভাব এবং প্রভাব এই সত্য থেকে অনুমান করা যেতে পারে যে হলিউড মুভিগুলি বিনিয়োগ করে *এই লেখকরা এই কাজে সমানভাবে অবদান রেখেছেন 1 https://erosnow.com/ 100 মিলিয়ন ডলার এবং প্রায়শই বিলিয়ন ডলারের বক্স অফিস সংগ্রহ করে। প্রথম চলমান ছবি The Great Train Robbery, 1903— ব্ল্যাক অ্যান্ড হোয়াইট উইথ নো সাউন্ড— বিংশ শতাব্দীর শুরুতে নির্মিত হয়েছিল। তারপর থেকে, শিল্পটি বেশ কয়েকটি রূপান্তরের মধ্য দিয়ে গেছে, এবং এখন লোকেরা যেকোন স্মার্ট ডিভাইসে তাদের পছন্দের 4K HD চলচ্চিত্রগুলি অবিলম্বে অ্যাক্সেস করতে পারে।


চলচ্চিত্রের ইতিহাস জুড়ে, একটি চলচ্চিত্রের ব্লকবাস্টার সাফল্যে অবদানকারীদের মধ্যে দুটি হল এর প্লট এবং গল্প বলার পদ্ধতির গুণমান। দর্শকরা যদি প্লটটি খুব অনুমানযোগ্য বলে মনে করেন তবে সিনেমাটির আবেদন মারাত্মকভাবে হ্রাস পায়। একটি সৃজনশীল এবং উত্তেজনাপূর্ণ স্ক্রিপ্ট লেখা, তাই, একটি গুরুত্বপূর্ণ প্রয়োজনীয়তা এবং অত্যন্ত চ্যালেঞ্জিং। এর সাথে সময় এবং বাজেটের সীমাবদ্ধতা যুক্ত করুন এবং স্ক্রিপ্ট লেখায় (অন্তত আংশিক) অটোমেশনের প্রয়োজনীয়তা স্পষ্ট হয়ে ওঠে।


AI-ভিত্তিক গল্প প্রজন্ম আগে ব্যবহার করা হয়েছে। লেখার ব্যস্ততা-প্রতিফলন জ্ঞানীয় ব্যাখ্যার উপর ভিত্তি করে, কম্পিউটার মডেল MEXICA (Pérez and Sharples, 2001) ছোট গল্পের জন্য কাঠামো তৈরি করে। BRUTUS (Bringsjord and Ferrucci, 1999) বিশ্বাসঘাতকতার মতো পূর্বনির্ধারিত থিম সহ ছোট গল্প তৈরি করে। প্রাক-প্রশিক্ষিত ট্রান্সফরমার মডেলের আগমনের সাথে, স্বয়ংক্রিয় গল্প প্রজন্মের হাতে একটি শট পেয়েছে। ট্রান্সফরমার মডেল যেমন GPT-2 এবং GPT-3 পাঠ্য তৈরির জন্য ব্যাপকভাবে ব্যবহৃত হয়। এই মডেলগুলি সৃজনশীল পাঠ্য তৈরি করার ক্ষমতা দেখিয়েছে, যদিও কখনও কখনও হ্যালুসিনেশন সহ (ঝাও এট আল।, 2020)। এই মডেলগুলির দ্বারা উত্পন্ন পাঠ্যের মাঝে মাঝে সুসংগততা এবং সমন্বয়ের অভাব থাকে। অন্যদিকে, টেমপ্লেট-ভিত্তিক মডেলগুলি সুসংগত পাঠ্য তৈরি করতে পারে কিন্তু প্লটে নতুন চরিত্র এবং ঘটনা তৈরিতে সৃজনশীলতার অভাব রয়েছে (কাল এবং রাস্তোগি, 2020)।


একটি চলচ্চিত্র তৈরির প্রক্রিয়া সাধারণত একটি ধারণা দিয়ে শুরু হয় যা পরে একটি প্লট তৈরি করতে ব্যবহৃত হয় যা মুভির স্ক্রিপ্ট তৈরির ভিত্তি হিসাবে ব্যবহৃত হয় (চিত্র 1)।


নভেল ডেটাসেট এই কাগজের একটি গুরুত্বপূর্ণ বৈশিষ্ট্য। আমরা বলিউড এবং হলিউডের সিনেমার প্লট এবং প্রম্পটগুলি ঘনিষ্ঠভাবে অধ্যয়ন করেছি। এই ধরনের প্লট এবং প্রম্পট যথাক্রমে উইকিপিডিয়া[2] এবং IMDb[3] থেকে স্ক্র্যাপ করা হয়েছে। প্লটগুলি তারপর 4-অভিনয়ের গল্প কাঠামো ব্যবহার করে টীকা করা হয়- সুপরিচিত 3-অভিনয় কাঠামোর একটি এক্সটেনশন (ক্ষেত্র, 1979)। 4-অ্যাক্টের কাঠামো এবং টীকা পদ্ধতিগুলি যথাক্রমে পরিশিষ্ট A.5 এবং বিভাগ 4-এ বিশদভাবে ব্যাখ্যা করা হয়েছে।


চিত্র 1: একজন চিত্রনাট্যকার সিনেমার স্ক্রিপ্ট তৈরি করতে যে চিন্তাধারা অনুসরণ করেন। একটি ধারণা (গল্পরেখা) একটি প্লটের দিকে নিয়ে যায় যা তারপর একটি চলচ্চিত্রের স্ক্রিপ্টে রূপান্তরিত হয়।


আমরা হলিউডের 1000টি সিনেমার দৃশ্য এবং তাদের সংক্ষিপ্ত বিবরণের একটি ডেটাসেট প্রবর্তন করি। স্ক্রিপ্টগুলি IMSDb[4] থেকে স্ক্র্যাপ করা হয়েছে। দৃশ্যগুলি একটি চিত্রনাট্যের চারটি প্রধান উপাদানের সাথে টীকা করা হয়েছে: স্লগলাইন, অ্যাকশন লাইন, চরিত্রের নাম এবং সংলাপ, পরিশিষ্ট A.4 এ বিশদভাবে বর্ণিত হয়েছে


আমরা একটি ওয়ার্কবেঞ্চ প্রবর্তন করি যাকে আমরা "কুরোসাওয়া" বলি, এতে ডেটাসেট এবং একজোড়া GPT-3 (Brown et al., 2020) মডেল রয়েছে যা উল্লিখিত ডেটাসেটগুলির সাথে সুসংহত। একটি GPT-3 মডেল গল্পের সংক্ষিপ্ত বিবরণ (15-40 শব্দ) দিয়ে একটি চলচ্চিত্রের প্লট তৈরি করে, অন্যটি প্রয়োজনীয় দৃশ্যের সংক্ষিপ্ত বিবরণের ভিত্তিতে একটি দৃশ্য তৈরি করে।


গুরুত্বপূর্ণভাবে, আমরা "কুরোসাওয়া" প্ল্যাটফর্ম প্রদান করেছি একটি বৃহত্তম মিডিয়া প্ল্যাটফর্ম যা সিনেমা এবং টিভি শো তৈরি, সঙ্গীত এবং সাউন্ডট্র্যাক ইত্যাদি তৈরির ব্যবসার সাথে জড়িত - বিভিন্ন চলচ্চিত্র শিল্পের স্ক্রিপ্ট এবং বিষয়বস্তু লেখকদের নতুন চলচ্চিত্র প্লট তৈরি করতে সহায়তা করার জন্য।


এই কাজে আমাদের অবদান নিম্নরূপ:


• আমাদের জানামতে, দৃশ্যের বর্ণনা থেকে সিনেমার দৃশ্য তৈরি করার ক্ষেত্রে এটিই প্রথম কাজ।


• আমরা দুটি ডেটাসেট তৈরি করি এবং প্রকাশ্যে প্রকাশ করি: (ক) 1000টি সিনেমার গল্প এবং তাদের সংশ্লিষ্ট প্লটগুলির একটি সমান্তরাল ডেটাসেট, (খ) 1000টি সিনেমার দৃশ্যের একটি সমান্তরাল ডেটাসেট এবং তাদের সংশ্লিষ্ট বিবরণ৷ (a), আমরা উইকিপিডিয়া থেকে উপলব্ধ সংশ্লিষ্ট মুভি প্লটগুলির সাথে IMDb থেকে উপলব্ধ মুভি স্টোরিলাইনগুলি লিঙ্ক করি। (b) এ, আমরা IMSDb থেকে উপলব্ধ সিনেমার দৃশ্যগুলিকে IMDb থেকে সংশ্লিষ্ট বর্ণনার সাথে লিঙ্ক করি।


• আমরা ম্যানুয়ালি একটি 4-অভিনয় কাঠামো অনুসারে মুভির প্লটগুলি টীকা করি যা সুপরিচিত 3-অভিনয় কাঠামোর একটি এক্সটেনশন (ক্ষেত্র, 1979)। মিডিয়া এবং বিনোদন শিল্পের পেশাদার স্ক্রিপ্টরাইটাররা আমাদের খুব কাছ থেকে গাইড করেছেন।


• আমরা ম্যানুয়ালি একটি দৃশ্যের চারটি প্রধান উপাদান সহ সিনেমার দৃশ্যগুলিকে টীকা করি: দৃশ্যের সংক্ষিপ্ত বিবরণ সহ স্লগলাইন, অ্যাকশন লাইন, চরিত্রের নাম এবং সংলাপ৷


• আমরা "কুরোসাওয়া" প্রবর্তন করি: একটি ওয়ার্কবেঞ্চ যা একাধিক ডেটাসেট এবং মডেল নিয়ে গঠিত যা চলচ্চিত্র শিল্পে স্ক্রিপ্ট এবং দৃশ্য লেখকদের সহায়তা করতে পারে।


এই কাগজটি CC 4.0 DEED লাইসেন্সের অধীনে arxiv-এ উপলব্ধ


[১] https://erosnow.com/


[২] https://www.wikipedia.org/


[৩] https://www.imdb.com/


[৪] https://www.imsdb.com/