paint-brush
এআই ফিডব্যাকের (কিউডিএআইএফ) মাধ্যমে গুণমান-বৈচিত্র্য: স্বায়ত্তশাসিত এআই সৃজনশীলতার দিকে একটি পদক্ষেপদ্বারা@feedbackloop
485 পড়া
485 পড়া

এআই ফিডব্যাকের (কিউডিএআইএফ) মাধ্যমে গুণমান-বৈচিত্র্য: স্বায়ত্তশাসিত এআই সৃজনশীলতার দিকে একটি পদক্ষেপ

দ্বারা The FeedbackLoop: #1 in PM Education4m2024/01/26
Read on Terminal Reader

অতিদীর্ঘ; পড়তে

কোয়ালিটি-ডাইভার্সিটি থ্রু এআই ফিডব্যাক (QDAIF) হল একটি অত্যাধুনিক পদ্ধতি যা ভাষার মডেল এবং মান-বৈচিত্র্য অনুসন্ধান অ্যালগরিদমগুলিকে একত্রিত করে স্বায়ত্তশাসিতভাবে বৈচিত্র্যময়, উচ্চ-মানের সৃজনশীল পাঠ্য তৈরি করতে। এই পদ্ধতি, সৃজনশীল লেখার ডোমেনে প্রদর্শিত, বিদ্যমান বেসলাইনগুলিকে ছাড়িয়ে যায়, স্বাধীন এআই সৃজনশীলতার দিকে একটি উল্লেখযোগ্য পদক্ষেপ প্রদর্শন করে।
featured image - এআই ফিডব্যাকের (কিউডিএআইএফ) মাধ্যমে গুণমান-বৈচিত্র্য: স্বায়ত্তশাসিত এআই সৃজনশীলতার দিকে একটি পদক্ষেপ
The FeedbackLoop: #1 in PM Education HackerNoon profile picture

লেখক:

(1) Herbie Bradley, CarperAI, CAML Lab, University of Cambridge & EleutherAI;

(2) অ্যান্ড্রু দাই, আলেফ আলফা;

(3) হান্না টিউফেল, আলেফ আলফা;

(4) জেনি ঝাং, 5 ডিপার্টমেন্ট অফ কম্পিউটার সায়েন্স, ইউনিভার্সিটি অফ ব্রিটিশ কলাম্বিয়া এবং ভেক্টর ইনস্টিটিউট;

(5) কোয়েন ওস্টারমেইজার, আলেফ আলফা;

(6) মার্কো বেলাজেন্টে, স্থিতিশীলতা এআই;

(7) জেফ ক্লুন, কম্পিউটার সায়েন্স বিভাগ, ব্রিটিশ কলাম্বিয়া বিশ্ববিদ্যালয়, ভেক্টর ইনস্টিটিউট এবং কানাডা সিফার এআই চেয়ার;

(8) কেনেথ স্ট্যানলি, মাভেন;

(9) গ্রেগরি স্কট, আলেফ আলফা;

(10) জোয়েল লেহম্যান, স্টোকাস্টিক ল্যাবস।

লিঙ্কের টেবিল

বিমূর্ত এবং ভূমিকা

পটভূমি এবং সম্পর্কিত কাজ

এপ্রোচ

ক্রিয়েটিভ রাইটিং ডোমেনে পরীক্ষা-নিরীক্ষা

আলোচনা এবং উপসংহার

একটি পরিশিষ্ট

বিমূর্ত

অনেক টেক্সট-জেনারেশন সমস্যায়, ব্যবহারকারীরা শুধুমাত্র একটি একক প্রতিক্রিয়া পছন্দ করতে পারে না, বরং উচ্চ-মানের আউটপুটগুলির একটি বিচিত্র পরিসর পছন্দ করতে পারে যেখান থেকে বেছে নিতে হবে। গুণমান-বৈচিত্র্য (QD) অনুসন্ধান অ্যালগরিদমগুলি প্রার্থীদের জনসংখ্যার ক্রমাগত উন্নতি এবং বৈচিত্র্যের মাধ্যমে এই জাতীয় ফলাফলগুলিকে লক্ষ্য করে। যাইহোক, গুণগত ডোমেনে QD-এর প্রয়োগযোগ্যতা, যেমন সৃজনশীল লেখা, অ্যালগরিদমিকভাবে গুণমান এবং বৈচিত্র্যের পরিমাপ নির্দিষ্ট করার অসুবিধার দ্বারা সীমিত করা হয়েছে। মজার বিষয় হল, ভাষা মডেলের (LMs) সাম্প্রতিক উন্নয়নগুলি AI প্রতিক্রিয়ার মাধ্যমে পথনির্দেশক অনুসন্ধানকে সক্ষম করেছে, যেখানে LMগুলিকে পাঠ্যের গুণগত দিকগুলি মূল্যায়ন করার জন্য প্রাকৃতিক ভাষায় অনুরোধ করা হয়। এই উন্নয়নকে কাজে লাগিয়ে, আমরা AI ফিডব্যাক (QDAIF) এর মাধ্যমে গুণ-বৈচিত্র্যের পরিচয় করি, যেখানে একটি বিবর্তনীয় অ্যালগরিদম LMs প্রয়োগ করে বৈচিত্র্য তৈরি করে এবং প্রার্থীর পাঠ্যের গুণমান এবং বৈচিত্র্য মূল্যায়ন করে। সৃজনশীল লেখার ডোমেনগুলিতে মূল্যায়ন করা হলে, QDAIF নন-QD নিয়ন্ত্রণের চেয়ে উচ্চ-মানের নমুনা সহ একটি নির্দিষ্ট অনুসন্ধানের স্থানকে কভার করে। আরও, QDAIF-উত্পন্ন সৃজনশীল পাঠ্যের মানব মূল্যায়ন এআই এবং মানব মূল্যায়নের মধ্যে যুক্তিসঙ্গত চুক্তিকে বৈধ করে। আমাদের ফলাফলগুলি এইভাবে সৃজনশীল এবং আসল সমাধানগুলির জন্য খোলামেলা অনুসন্ধানের জন্য গাইড করার জন্য AI প্রতিক্রিয়ার সম্ভাবনাকে হাইলাইট করে, একটি রেসিপি প্রদান করে যা আপাতদৃষ্টিতে অনেক ডোমেন এবং পদ্ধতিতে সাধারণীকরণ করে। এইভাবে, QDAIF হল AI সিস্টেমগুলির দিকে একটি পদক্ষেপ যা স্বাধীনভাবে অনুসন্ধান, বৈচিত্র্য, মূল্যায়ন এবং উন্নতি করতে পারে, যা উদ্ভাবনের জন্য মানব সমাজের ক্ষমতার অন্তর্নিহিত মূল দক্ষতাগুলির মধ্যে একটি।

1। পরিচিতি

মানুষের উদ্ভাবন শুধুমাত্র সৃজনশীলতার জন্য একটি উত্পাদনশীল ক্ষমতা নয়, এর মধ্যে নতুন ধারণা এবং শিল্পকর্মের বিষয়গত গুণমান মূল্যায়ন করার ক্ষমতাও অন্তর্ভুক্ত। দুর্দান্ত ধারণাগুলি খুব কমই পুরো কাপড় থেকে একবারে উত্পন্ন হয়, বরং ধীরে ধীরে বিস্তৃতকরণ এবং সংশোধনের বিভিন্ন শৃঙ্খলের মাধ্যমে আবির্ভূত হয় (স্ট্যানলি এবং লেহম্যান, 2015)। এই ধরনের ধারণার গাছ সফলভাবে নেভিগেট করার জন্য, স্রষ্টাকে অবশ্যই মূল্যায়ন করতে হবে যে শৃঙ্খলে কোন ধাপগুলি আরও অনুসরণ করা মূল্যবান, একটি প্রশ্ন যা অত্যন্ত বিষয়গত হতে পারে, বিশেষত শৈল্পিক বা সাহিত্যিক মাত্রা সহ ডোমেনে।


এখন অবধি, এমনকি AI প্রার্থীদের সরবরাহ করতে পারলেও, এই জাতীয় বিষয়গতভাবে টিংড মূল্যায়নের আশা মানুষের সাথে দৃঢ়ভাবে ছিল। যাইহোক, সাম্প্রতিক বছরগুলির উদীয়মান ভিত্তি মডেল প্রযুক্তি (Bommasani et al., 2021) এর মানে হল যে মডেলটি মূল্যায়নকারীর ভূমিকাও পালন করতে পারে, এমনকি যখন মূল্যায়ন আংশিক বিষয়ভিত্তিক হয় (মাদান এট আল।, 2023)। এইভাবে, প্রথমবারের মতো, একটি সম্পূর্ণ ধারণার প্রক্রিয়া যা বিভিন্ন আকর্ষণীয় শিল্পকর্মের একটি সেট ফিরিয়ে দেয় নীতিগতভাবে স্বয়ংক্রিয় হতে পারে। এই প্রক্রিয়াটি সম্পূর্ণরূপে LM দ্বারা তাদের নিজস্বভাবে চালানো যায় না, তবে একটি সংক্ষিপ্ত উপায়ে মডেল কলগুলির সাথে একটি অনুসন্ধান অ্যালগরিদমকে একসাথে চেইন করা প্রয়োজন৷ এই কাগজটি এই সম্ভাব্যতা অর্জনের একটি উপায় তুলে ধরে: গুণমান-বৈচিত্র্য (QD) (Mouret & Clune, 2015) ক্ষেত্রের সাথে LM-কে একত্রিত করা, যা একটি ডিজাইনের জায়গা জুড়ে উচ্চ-মানের সমাধান তৈরি করে এমন অনুসন্ধান প্রক্রিয়াগুলি কীভাবে ডিজাইন করা যায় তার উপর কেন্দ্র করে। .


চিত্র 1: QDAIF (বাম) বেসলাইনের (ডানদিকে) তুলনায় বৈচিত্র্যময়, উচ্চ-মানের গল্প সহ আরও অনুসন্ধানের স্থান কভার করে। বেসলাইন হল LMX, কোয়ালিটি-অনলি (Meyerson et al., 2023), যা শুধুমাত্র সমাধানের মানের জন্য অপ্টিমাইজ করে। QDAIF একজন গুপ্তচর এবং একজন রাজনীতিবিদ সম্পর্কে আরও আকর্ষণীয় গল্প আবিষ্কার করেছে, যেমন রোমান্সের গল্পগুলি সুখী সমাপ্তির সাথে, ট্র্যাজিক-এন্ডিং সহ হরর গল্পের মতো উদাহরণগুলিকে কভার করে৷ বেসলাইন একটি কাঙ্খিত গুপ্তচর চরিত্রের অভাবের কারণে নিম্ন মানের স্কোর সহ একটি গল্প (ডান-মধ্যম অবস্থান, "জেসন" দিয়ে শুরু) তৈরি করেছে (লাল রঙের বিন দ্বারা চিহ্নিত, একটি নিরপেক্ষ সমাপ্তি সহ একটি গল্পের জন্য, এবং ঝুঁকে আছে) বিভীষিকা থেকে)। QDAIF এই একই নিরপেক্ষ বিনের জন্য একটি ভাল, আরও-প্রাসঙ্গিক গল্প (নিচে-মাঝের অবস্থান, "একজন ধনী রাজনীতিবিদ" দিয়ে শুরু) আবিষ্কার করেছে।


QD অ্যালগরিদমের প্রধান অন্তর্দৃষ্টি হল স্পষ্টভাবে বজায় রাখা এবং উচ্চ-মানের বিভিন্ন প্রতিক্রিয়া খোঁজা। সাধারণত এই ধরনের সার্চ অ্যালগরিদমগুলির জন্য বৈচিত্র্য এবং মানের হস্ত-পরিকল্পিত পরিমাপ প্রয়োজন, সেইসাথে অর্থপূর্ণ বৈচিত্র তৈরি করার উপায়। তবুও সবচেয়ে আকর্ষণীয় এবং জটিল ডোমেনগুলি প্রায় সবসময় কর্মক্ষমতা, বৈচিত্র্য এবং বৈচিত্র্যের ধারণাগুলিকে জড়িত করে যেগুলি বিষয়ভিত্তিক বা অ্যালগরিদমিকভাবে নির্দিষ্ট করা কঠিন। LMs (Lehman et al., 2022; Meyerson et al., 2023) এর মাধ্যমে বৈচিত্র্য তৈরি করে এবং LMs (Ahn et al., 2022) এর মাধ্যমে সম্ভাব্য সমাধানের গুণমান মূল্যায়ন করে, আমরা দেখাই যে LMs মূল্যায়নের জন্যও ব্যবহার করা যেতে পারে। বৈচিত্র্যের গুণগত দিক। এইভাবে, LMs QD অনুসন্ধানের তিনটি প্রধান উপাদানকে সূচনা করতে পারে, যার ফলে শক্তিশালী নতুন QD অ্যালগরিদম সক্ষম হয় যা ক্রমাগত LM অগ্রগতির কোটটেল চালাতে পারে, যাকে আমরা AI ফিডব্যাকের (QDAIF) মাধ্যমে গুণ-বৈচিত্র্যের নাম দিয়েছি। এই ধরনের QDAIF মডেল ফাইন-টিউনিং-এর প্রয়োজন ছাড়াই আরও-স্বজ্ঞাত বৈচিত্র্য ব্যবস্থার মাধ্যমে একটি LM প্রম্পটে বৈচিত্র্যময়, উচ্চ-মানের প্রতিক্রিয়াগুলি অন্বেষণ করতে এবং ফিরিয়ে দিতে পারে (যদিও, এটি LM-এর জন্য সূক্ষ্ম-টিউনিং তৈরি করে স্ব-উন্নতির জন্যও ব্যবহার করা যেতে পারে। ডেটা (Lehman et al., 2022; Chen et al., 2023)), AI-উত্পাদিত অ্যালগরিদমগুলির দিকে (Clune, 2019)) উত্পন্ন ডেটার মাধ্যমে স্ব-কিউরেটেড কার্যকর শিক্ষার পরিবেশের জন্য একটি আকর্ষণীয় দিকনির্দেশ।


আমরা তিনটি সৃজনশীল লেখার ডোমেন জুড়ে QDAIF মূল্যায়ন করি: মতামত লেখা, ছোট গল্প এবং কবিতা। ধারণাটি হল যে এই ধরনের সৃজনশীল ডোমেনে, ব্যবহারকারীরা প্রায়ই সম্ভাব্য গল্প বা কবিতাগুলির একটি বিস্তৃত পরিসর দেখতে উপভোগ করে যেগুলি থেকে বেছে নেওয়া বা অনুপ্রাণিত হতে পারে। পরিমাণগত ফলাফল নির্দেশ করে যে QDAIF উল্লেখযোগ্যভাবে বিদ্যমান বেসলাইনকে ছাড়িয়ে গেছে। অতিরিক্তভাবে, মানুষের মূল্যায়নের মাধ্যমে, আমরা মানব এবং এআই-উত্পন্ন প্রতিক্রিয়ার মধ্যে একটি শক্তিশালী সারিবদ্ধতা লক্ষ্য করি, অভিজ্ঞতামূলক প্রমাণ প্রদান করে যে AI প্রতিক্রিয়া গ্রাউন্ডেড এবং পদ্ধতিটি অনুশীলনে কাজ করতে পারে (অর্থাৎ এটি মানুষের দ্বারা পরিমাপ করা উন্নত গুণমান এবং বৈচিত্র্য দেয়)। সামগ্রিকভাবে, QDAIF আমাদেরকে AI মডেলগুলির এক ধাপ কাছাকাছি নিয়ে আসে যা স্বাধীনভাবে অনুসন্ধান এবং উদ্ভাবন করতে পারে, মানুষের মূল ক্ষমতাগুলির মধ্যে একটি যা তাদের সংস্কৃতি এবং বিজ্ঞান তৈরি করতে দেয় (স্ট্যানলি এট আল।, 2017)।




[১] প্রকল্প পৃষ্ঠা: https://qdaif.github.io/


এই কাগজটি CC 4.0 লাইসেন্সের অধীনে arxiv-এ উপলব্ধ