লেখক:
(1) Herbie Bradley, CarperAI, CAML Lab, University of Cambridge & EleutherAI;
(2) অ্যান্ড্রু দাই, আলেফ আলফা;
(3) হান্না টিউফেল, আলেফ আলফা;
(4) জেনি ঝাং, 5 ডিপার্টমেন্ট অফ কম্পিউটার সায়েন্স, ইউনিভার্সিটি অফ ব্রিটিশ কলাম্বিয়া এবং ভেক্টর ইনস্টিটিউট;
(5) কোয়েন ওস্টারমেইজার, আলেফ আলফা;
(6) মার্কো বেলাজেন্টে, স্থিতিশীলতা এআই;
(7) জেফ ক্লুন, কম্পিউটার সায়েন্স বিভাগ, ব্রিটিশ কলাম্বিয়া বিশ্ববিদ্যালয়, ভেক্টর ইনস্টিটিউট এবং কানাডা সিফার এআই চেয়ার;
(8) কেনেথ স্ট্যানলি, মাভেন;
(9) গ্রেগরি স্কট, আলেফ আলফা;
(10) জোয়েল লেহম্যান, স্টোকাস্টিক ল্যাবস।
বিমূর্ত এবং ভূমিকা
পটভূমি এবং সম্পর্কিত কাজ
এপ্রোচ
ক্রিয়েটিভ রাইটিং ডোমেনে পরীক্ষা-নিরীক্ষা
আলোচনা এবং উপসংহার
একটি পরিশিষ্ট
অনেক টেক্সট-জেনারেশন সমস্যায়, ব্যবহারকারীরা শুধুমাত্র একটি একক প্রতিক্রিয়া পছন্দ করতে পারে না, বরং উচ্চ-মানের আউটপুটগুলির একটি বিচিত্র পরিসর পছন্দ করতে পারে যেখান থেকে বেছে নিতে হবে। গুণমান-বৈচিত্র্য (QD) অনুসন্ধান অ্যালগরিদমগুলি প্রার্থীদের জনসংখ্যার ক্রমাগত উন্নতি এবং বৈচিত্র্যের মাধ্যমে এই জাতীয় ফলাফলগুলিকে লক্ষ্য করে। যাইহোক, গুণগত ডোমেনে QD-এর প্রয়োগযোগ্যতা, যেমন সৃজনশীল লেখা, অ্যালগরিদমিকভাবে গুণমান এবং বৈচিত্র্যের পরিমাপ নির্দিষ্ট করার অসুবিধার দ্বারা সীমিত করা হয়েছে। মজার বিষয় হল, ভাষা মডেলের (LMs) সাম্প্রতিক উন্নয়নগুলি AI প্রতিক্রিয়ার মাধ্যমে পথনির্দেশক অনুসন্ধানকে সক্ষম করেছে, যেখানে LMগুলিকে পাঠ্যের গুণগত দিকগুলি মূল্যায়ন করার জন্য প্রাকৃতিক ভাষায় অনুরোধ করা হয়। এই উন্নয়নকে কাজে লাগিয়ে, আমরা AI ফিডব্যাক (QDAIF) এর মাধ্যমে গুণ-বৈচিত্র্যের পরিচয় করি, যেখানে একটি বিবর্তনীয় অ্যালগরিদম LMs প্রয়োগ করে বৈচিত্র্য তৈরি করে এবং প্রার্থীর পাঠ্যের গুণমান এবং বৈচিত্র্য মূল্যায়ন করে। সৃজনশীল লেখার ডোমেনগুলিতে মূল্যায়ন করা হলে, QDAIF নন-QD নিয়ন্ত্রণের চেয়ে উচ্চ-মানের নমুনা সহ একটি নির্দিষ্ট অনুসন্ধানের স্থানকে কভার করে। আরও, QDAIF-উত্পন্ন সৃজনশীল পাঠ্যের মানব মূল্যায়ন এআই এবং মানব মূল্যায়নের মধ্যে যুক্তিসঙ্গত চুক্তিকে বৈধ করে। আমাদের ফলাফলগুলি এইভাবে সৃজনশীল এবং আসল সমাধানগুলির জন্য খোলামেলা অনুসন্ধানের জন্য গাইড করার জন্য AI প্রতিক্রিয়ার সম্ভাবনাকে হাইলাইট করে, একটি রেসিপি প্রদান করে যা আপাতদৃষ্টিতে অনেক ডোমেন এবং পদ্ধতিতে সাধারণীকরণ করে। এইভাবে, QDAIF হল AI সিস্টেমগুলির দিকে একটি পদক্ষেপ যা স্বাধীনভাবে অনুসন্ধান, বৈচিত্র্য, মূল্যায়ন এবং উন্নতি করতে পারে, যা উদ্ভাবনের জন্য মানব সমাজের ক্ষমতার অন্তর্নিহিত মূল দক্ষতাগুলির মধ্যে একটি।
মানুষের উদ্ভাবন শুধুমাত্র সৃজনশীলতার জন্য একটি উত্পাদনশীল ক্ষমতা নয়, এর মধ্যে নতুন ধারণা এবং শিল্পকর্মের বিষয়গত গুণমান মূল্যায়ন করার ক্ষমতাও অন্তর্ভুক্ত। দুর্দান্ত ধারণাগুলি খুব কমই পুরো কাপড় থেকে একবারে উত্পন্ন হয়, বরং ধীরে ধীরে বিস্তৃতকরণ এবং সংশোধনের বিভিন্ন শৃঙ্খলের মাধ্যমে আবির্ভূত হয় (স্ট্যানলি এবং লেহম্যান, 2015)। এই ধরনের ধারণার গাছ সফলভাবে নেভিগেট করার জন্য, স্রষ্টাকে অবশ্যই মূল্যায়ন করতে হবে যে শৃঙ্খলে কোন ধাপগুলি আরও অনুসরণ করা মূল্যবান, একটি প্রশ্ন যা অত্যন্ত বিষয়গত হতে পারে, বিশেষত শৈল্পিক বা সাহিত্যিক মাত্রা সহ ডোমেনে।
এখন অবধি, এমনকি AI প্রার্থীদের সরবরাহ করতে পারলেও, এই জাতীয় বিষয়গতভাবে টিংড মূল্যায়নের আশা মানুষের সাথে দৃঢ়ভাবে ছিল। যাইহোক, সাম্প্রতিক বছরগুলির উদীয়মান ভিত্তি মডেল প্রযুক্তি (Bommasani et al., 2021) এর মানে হল যে মডেলটি মূল্যায়নকারীর ভূমিকাও পালন করতে পারে, এমনকি যখন মূল্যায়ন আংশিক বিষয়ভিত্তিক হয় (মাদান এট আল।, 2023)। এইভাবে, প্রথমবারের মতো, একটি সম্পূর্ণ ধারণার প্রক্রিয়া যা বিভিন্ন আকর্ষণীয় শিল্পকর্মের একটি সেট ফিরিয়ে দেয় নীতিগতভাবে স্বয়ংক্রিয় হতে পারে। এই প্রক্রিয়াটি সম্পূর্ণরূপে LM দ্বারা তাদের নিজস্বভাবে চালানো যায় না, তবে একটি সংক্ষিপ্ত উপায়ে মডেল কলগুলির সাথে একটি অনুসন্ধান অ্যালগরিদমকে একসাথে চেইন করা প্রয়োজন৷ এই কাগজটি এই সম্ভাব্যতা অর্জনের একটি উপায় তুলে ধরে: গুণমান-বৈচিত্র্য (QD) (Mouret & Clune, 2015) ক্ষেত্রের সাথে LM-কে একত্রিত করা, যা একটি ডিজাইনের জায়গা জুড়ে উচ্চ-মানের সমাধান তৈরি করে এমন অনুসন্ধান প্রক্রিয়াগুলি কীভাবে ডিজাইন করা যায় তার উপর কেন্দ্র করে। .
QD অ্যালগরিদমের প্রধান অন্তর্দৃষ্টি হল স্পষ্টভাবে বজায় রাখা এবং উচ্চ-মানের বিভিন্ন প্রতিক্রিয়া খোঁজা। সাধারণত এই ধরনের সার্চ অ্যালগরিদমগুলির জন্য বৈচিত্র্য এবং মানের হস্ত-পরিকল্পিত পরিমাপ প্রয়োজন, সেইসাথে অর্থপূর্ণ বৈচিত্র তৈরি করার উপায়। তবুও সবচেয়ে আকর্ষণীয় এবং জটিল ডোমেনগুলি প্রায় সবসময় কর্মক্ষমতা, বৈচিত্র্য এবং বৈচিত্র্যের ধারণাগুলিকে জড়িত করে যেগুলি বিষয়ভিত্তিক বা অ্যালগরিদমিকভাবে নির্দিষ্ট করা কঠিন। LMs (Lehman et al., 2022; Meyerson et al., 2023) এর মাধ্যমে বৈচিত্র্য তৈরি করে এবং LMs (Ahn et al., 2022) এর মাধ্যমে সম্ভাব্য সমাধানের গুণমান মূল্যায়ন করে, আমরা দেখাই যে LMs মূল্যায়নের জন্যও ব্যবহার করা যেতে পারে। বৈচিত্র্যের গুণগত দিক। এইভাবে, LMs QD অনুসন্ধানের তিনটি প্রধান উপাদানকে সূচনা করতে পারে, যার ফলে শক্তিশালী নতুন QD অ্যালগরিদম সক্ষম হয় যা ক্রমাগত LM অগ্রগতির কোটটেল চালাতে পারে, যাকে আমরা AI ফিডব্যাকের (QDAIF) মাধ্যমে গুণ-বৈচিত্র্যের নাম দিয়েছি। এই ধরনের QDAIF মডেল ফাইন-টিউনিং-এর প্রয়োজন ছাড়াই আরও-স্বজ্ঞাত বৈচিত্র্য ব্যবস্থার মাধ্যমে একটি LM প্রম্পটে বৈচিত্র্যময়, উচ্চ-মানের প্রতিক্রিয়াগুলি অন্বেষণ করতে এবং ফিরিয়ে দিতে পারে (যদিও, এটি LM-এর জন্য সূক্ষ্ম-টিউনিং তৈরি করে স্ব-উন্নতির জন্যও ব্যবহার করা যেতে পারে। ডেটা (Lehman et al., 2022; Chen et al., 2023)), AI-উত্পাদিত অ্যালগরিদমগুলির দিকে (Clune, 2019)) উত্পন্ন ডেটার মাধ্যমে স্ব-কিউরেটেড কার্যকর শিক্ষার পরিবেশের জন্য একটি আকর্ষণীয় দিকনির্দেশ।
আমরা তিনটি সৃজনশীল লেখার ডোমেন জুড়ে QDAIF মূল্যায়ন করি: মতামত লেখা, ছোট গল্প এবং কবিতা। ধারণাটি হল যে এই ধরনের সৃজনশীল ডোমেনে, ব্যবহারকারীরা প্রায়ই সম্ভাব্য গল্প বা কবিতাগুলির একটি বিস্তৃত পরিসর দেখতে উপভোগ করে যেগুলি থেকে বেছে নেওয়া বা অনুপ্রাণিত হতে পারে। পরিমাণগত ফলাফল নির্দেশ করে যে QDAIF উল্লেখযোগ্যভাবে বিদ্যমান বেসলাইনকে ছাড়িয়ে গেছে। অতিরিক্তভাবে, মানুষের মূল্যায়নের মাধ্যমে, আমরা মানব এবং এআই-উত্পন্ন প্রতিক্রিয়ার মধ্যে একটি শক্তিশালী সারিবদ্ধতা লক্ষ্য করি, অভিজ্ঞতামূলক প্রমাণ প্রদান করে যে AI প্রতিক্রিয়া গ্রাউন্ডেড এবং পদ্ধতিটি অনুশীলনে কাজ করতে পারে (অর্থাৎ এটি মানুষের দ্বারা পরিমাপ করা উন্নত গুণমান এবং বৈচিত্র্য দেয়)। সামগ্রিকভাবে, QDAIF আমাদেরকে AI মডেলগুলির এক ধাপ কাছাকাছি নিয়ে আসে যা স্বাধীনভাবে অনুসন্ধান এবং উদ্ভাবন করতে পারে, মানুষের মূল ক্ষমতাগুলির মধ্যে একটি যা তাদের সংস্কৃতি এবং বিজ্ঞান তৈরি করতে দেয় (স্ট্যানলি এট আল।, 2017)।
[১] প্রকল্প পৃষ্ঠা: https://qdaif.github.io/
এই কাগজটি CC 4.0 লাইসেন্সের অধীনে arxiv-এ উপলব্ধ ।