লেখক:  (1) প্রেরক গান্ধী, কম্পিউটার সায়েন্স অ্যান্ড ইঞ্জিনিয়ারিং বিভাগ, ইন্ডিয়ান ইনস্টিটিউট অফ টেকনোলজি বোম্বে, মুম্বাই, prerakgandhi@cse.iitb.ac.in, এবং এই লেখকরা এই কাজে সমানভাবে অবদান রেখেছেন;  (2) বিশাল প্রামানিক, কম্পিউটার সায়েন্স অ্যান্ড ইঞ্জিনিয়ারিং বিভাগ, ইন্ডিয়ান ইনস্টিটিউট অফ টেকনোলজি বোম্বে, মুম্বাই, vishalpramanik,pb@cse.iitb.ac.in, এবং এই লেখকরা এই কাজে সমানভাবে অবদান রেখেছেন;  (3) পুষ্পক ভট্টাচার্য, কম্পিউটার সায়েন্স অ্যান্ড ইঞ্জিনিয়ারিং বিভাগ, ইন্ডিয়ান ইনস্টিটিউট অফ টেকনোলজি বোম্বে, মুম্বাই।  লিঙ্কের টেবিল   বিমূর্ত এবং ভূমিকা   প্রেরণা   সম্পর্কিত কাজ   ডেটাসেট   পরীক্ষা এবং মূল্যায়ন   ফলাফল এবং বিশ্লেষণ   উপসংহার এবং ভবিষ্যতের কাজ   সীমাবদ্ধতা এবং রেফারেন্স   উঃ পরিশিষ্ট  6. ফলাফল এবং বিশ্লেষণ  আমরা আমাদের পর্যবেক্ষণ এবং মূল্যায়ন উপস্থাপন. আমাদের কাজের প্রকৃতি মানুষের মূল্যায়নকে স্বয়ংক্রিয় মূল্যায়নের চেয়ে অগ্রাধিকার দেয় (এটি স্বয়ংক্রিয় মুভি স্ক্রিপ্ট প্রজন্মের জন্য, সর্বোপরি!) আমাদের তৈরি করা প্লট এবং দৃশ্যগুলির গুণগত বিশ্লেষণ আমাদের শিল্প অংশীদার, সুপরিচিত মিডিয়া প্ল্যাটফর্মের 5 পেশাদার স্ক্রিপ্টরাইটারের প্রতিক্রিয়ার উপর ভিত্তি করে।  6.1। প্লট জেনারেশন  6.1.1। স্বয়ংক্রিয় মূল্যায়ন  সারণি 1 একাধিক GPT-3 প্লট জেনারেশন মডেলের জন্য স্বয়ংক্রিয় মূল্যায়ন স্কোর দেখায়।   6.1.2। হিউম্যান রেটিং  আমরা হলিউড টীকাযুক্ত সংক্ষিপ্ত ইনপুট মডেলের উপর মানব মূল্যায়ন করেছি। প্রতিটি গ্রুপের সাথে 3 জনের পাঁচটি গ্রুপ দ্বারা মূল্যায়ন করা হয়েছিল   10টি অনন্য প্লট বরাদ্দ করা হয়েছে। 5টি বৈশিষ্ট্যের জন্য প্রদত্ত রেটিং চিত্র 5-এ রয়েছে। সাবলীলতা, সৃজনশীলতা, পছন্দ, সুসংগততা এবং প্রাসঙ্গিকতার গড় স্কোর যথাক্রমে   এবং   । প্রায় 4 এর সাবলীলতা একটি ভাষা মডেল হিসাবে GPT-3 এর শক্তির একটি সূচক। সৃজনশীলতা এবং পছন্দযোগ্যতা প্রায় 3.0 এর মূল্যে সম্মানজনক। কম BLEU স্কোর গড় সৃজনশীলতা স্কোর সমর্থন করে (সারণী 1)। চিত্র 5 নির্দেশ করে যে সুসংগততা এবং প্রাসঙ্গিকতার এখনও উন্নতির জন্য বড় জায়গা রয়েছে। 3.98, 3.29, 2.97, 2.65 2.55  MAUVE (Pillutla et al., 2021) মান নিউরাল টেক্সট এবং মানুষের টেক্সটের মধ্যে ব্যবধান পরিমাপ করে। আমরা আলাদাভাবে 20টি প্লট এবং 50টি প্লটের জন্য MAUVE স্কোর গণনা করেছি। দুটি পরীক্ষার জন্য MAUVE স্কোরের ওজনযুক্ত গড় হল   যা যুক্তিসঙ্গতভাবে ভাল। 0.48  6.1.3। গুণগত পর্যবেক্ষণ  আমাদের শিল্প অংশীদার থেকে পেশাদার স্ক্রিপ্টরাইটাররা নিম্নলিখিত পর্যবেক্ষণগুলি দিয়েছেন:   অ-টীকাযুক্ত হলিউড প্লট  • বিল্ড আপ সৃজনশীল এবং আকর্ষণীয়, কিন্তু সমাপ্তি বেমানান হয়ে যায়।  • কিছু অক্ষর যা শুরুতে প্রবর্তিত হয় তা আর কখনও উল্লেখ করা হয় না।  • আউটপুট মূল পয়েন্ট বা ইনপুট উল্লিখিত থিম চিত্রিত করা হয় না.   টীকাযুক্ত হলিউড প্লট  • প্লটগুলি অনেক বেশি সুসংগত, এবং শেষগুলি যৌক্তিক৷  • এখনও হ্যালুসিনেশন আছে (সমস্ত মডেলের একটি সাধারণ বৈশিষ্ট্য)।  • দীর্ঘ ইনপুটগুলি প্লটগুলিকে মূল পয়েন্টগুলিতে আরও মনোযোগী করে তুলেছে।   টীকাযুক্ত হলিউড প্লট সহ জেনারস অন্তর্ভুক্ত  • উপরের পয়েন্টগুলির পাশাপাশি, এখন তৈরি করা প্লটগুলি লেখক যে সিনেমা তৈরি করতে চান তার জেনার বা ঘরানার দিকে আরও ঝুঁকছে।  • জেনার সংযোজন মডেল দ্বারা উত্পন্ন প্লট ধরনের উপর কিছু নিয়ন্ত্রণ দেয়।   টীকাযুক্ত বলিউড প্লট  • আউটপুটগুলি শেষ দুটি অনুচ্ছেদে অসামঞ্জস্য দেখায় এবং প্লট জুড়ে একই অক্ষরের পুনরাবৃত্তি।  • প্লটের প্রবাহ যথেষ্ট দ্রুত নয়, অর্থাৎ প্লটটি বেশি এগিয়ে যায় না।  • অনেক আউটপুট তাদের চারপাশে একটি 1990 এর থিম আছে, যেখানে অক্ষরগুলি আলাদা করা হয় এবং তারপর একে অপরকে পরে খুঁজে পায়। এটি কম আধুনিক প্লট সহ একটি তির্যক ডেটাসেটের কারণে।  6.2। দৃশ্য প্রজন্ম  আমরা আমাদের ডেটাসেট দিয়ে দৃশ্য তৈরির জন্য GPT-3 ফাইন-টিউন করেছি। আমরা 5.1-এ উল্লিখিত মডেলগুলি ব্যবহার করে দশটি দৃশ্য তৈরি করেছি। পরিশিষ্টে চিত্র 7। একটি সম্পূর্ণ উত্পন্ন দৃশ্যের উদাহরণ দেখায়।  6.2.1। হিউম্যান রেটিং  আমরা উপরের মডেল দ্বারা উত্পন্ন 10 টি দৃশ্যের উপর একটি মানব মূল্যায়ন পরিচালনা করেছি। 5 জন লোক লিকার্ট স্কেল ব্যবহার করে দৃশ্যের মূল্যায়ন করেছেন। পাঁচটি বৈশিষ্ট্যের রেটিং চিত্র 5-এ দেখা যেতে পারে। সাবলীলতা, সৃজনশীলতা, পছন্দ, সুসংগততা এবং প্রাসঙ্গিকতার গড় স্কোর যথাক্রমে   এবং   । সমস্ত মান নিরপেক্ষ চিহ্নের উপরে এবং বোঝায় যে উত্পন্ন দৃশ্যগুলি মানব-লিখিত দৃশ্যের কাছাকাছি।  4.48, 3.9, 3.48, 3.46 3.86  6.2.2। গুণগত পর্যবেক্ষণ  এই বিভাগে, আমরা GPT-3 মডেল দ্বারা উত্পন্ন দৃশ্যের গুণমান বিশ্লেষণ করি। এই বিশ্লেষণটি পূর্বে উল্লেখিত মিডিয়া কোম্পানির পেশাদার স্ক্রিপ্টরাইটারদের দ্বারা করা হয়েছে।  • মডেলটি একটি সুগঠিত দৃশ্য তৈরি করে।  • এটি নতুন অক্ষর তৈরি করতে পারে এবং কথোপকথন তৈরি করতে পারে এমনকি যখন সেগুলি গুরুত্বহীন হয়।  • ইনপুট থেকে মূল পয়েন্টগুলি আউটপুটে পাওয়া যাবে।  • কিছু লাইন আছে যেগুলো পুনরাবৃত্তিমূলক।  • আউটপুট সম্পূর্ণরূপে সুসংগত নয়।  এই কাগজটি CC 4.0 DEED লাইসেন্সের অধীনে   । arxiv-এ উপলব্ধ

Part of HackerNoon's growing list of open-source research papers, promoting free access to academic material.

Teleplay.Tech

From teleplay to technology, we weave a narrative tapestry that dances between writing, CGI, and action.

Teleplay's blog

গল্পের মূল ভাষায় এই অডিও তৈরি!

"কুরোসাওয়া": একজন স্ক্রিপ্ট লেখকের সহকারী: ফলাফল এবং বিশ্লেষণ

About Author

মন্তব্য

আসে ট্যাগ

এই নিবন্ধটি উপস্থাপন করা হয়েছে

Related Stories

হ্যাকারনুন লেখার প্রতিযোগিতা জিততে চান? #crypto-api প্রতিযোগিতার বিজয়ীরা কী সুপারিশ করেন তা এখানে

অদেখা স্তরগুলি: কেন ব্যবহারকারীর সাক্ষাত্কারগুলি একটি অপরিবর্তনীয় সম্পদ

ফোরাম থেকে ফিড পর্যন্ত: কীভাবে সোশ্যাল মিডিয়া অ্যালগরিদম ডিজিটাল ইন্টারঅ্যাকশনকে আকার দেয়

ক্লাউড সনেট 3.5 সিস্টেম প্রম্পট লিক: একটি ফরেনসিক বিশ্লেষণ

হ্যাকারনুন লেখার প্রতিযোগিতা জিততে চান? #crypto-api প্রতিযোগিতার বিজয়ীরা কী সুপারিশ করেন তা এখানে

অদেখা স্তরগুলি: কেন ব্যবহারকারীর সাক্ষাত্কারগুলি একটি অপরিবর্তনীয় সম্পদ

ফোরাম থেকে ফিড পর্যন্ত: কীভাবে সোশ্যাল মিডিয়া অ্যালগরিদম ডিজিটাল ইন্টারঅ্যাকশনকে আকার দেয়

ক্লাউড সনেট 3.5 সিস্টেম প্রম্পট লিক: একটি ফরেনসিক বিশ্লেষণ

Light-Mode

Classic

Newspaper

Minty

Dark-Mode

Neon Noir

Minty

HN StartUps