একটি এআই ভাষার মডেল কি যথেষ্ট স্ব-সচেতন হতে পারে যখন এটি মূল্যায়ন করা হচ্ছে বুঝতে পারে? অ্যানথ্রপিকের তাদের ফ্ল্যাগশিপের অভ্যন্তরীণ পরীক্ষা থেকে একটি আকর্ষণীয় উপাখ্যান
নৃতাত্ত্বিক গবেষক থেকে রিপোর্ট অনুযায়ী
এখানে কিভাবে এটা কাজ করে:
গবেষকরা একটি সম্পূর্ণ এলোমেলো, প্রসঙ্গ-বহির্ভূত বিবৃতি ("সুই") নেন এবং এটিকে অসংলগ্ন নথির ("খড়ের গাদা") একটি বিশাল সংগ্রহের মধ্যে কবর দেন। এরপর এআই মডেলটিকে আশেপাশের সমস্ত অপ্রাসঙ্গিক বিষয়বস্তুর মধ্যে থেকে সেই নির্দিষ্ট "সুই" বিবৃতিটি পুনরুদ্ধার করার দায়িত্ব দেওয়া হয়।
উদ্দেশ্য হল মডেলটিকে উন্নত জ্ঞানীয় দক্ষতা অনুশীলন করতে বাধ্য করা — বিস্তৃত প্রেক্ষাপট বোঝা, যৌক্তিক অনুমান তৈরি করা, অপ্রাসঙ্গিক তথ্য উপেক্ষা করা এবং একটি বৃহৎ কর্পাস থেকে সঠিকভাবে ডেটা পয়েন্ট পুনরুদ্ধার করা। এটি একটি কার্যকর উপায় যা একটি AI এর সামগ্রিক পরিস্থিতির বোঝার চাপ-পরীক্ষার জন্য যা এটি পরিচালনা করছে।
Claude 3 Opus মূল্যায়নের জন্য যা ভ্রু তুলেছিল, নৃতাত্ত্বিক সফ্টওয়্যার প্রোগ্রামিং, উদ্যোক্তা কৌশল এবং "খড়ের গাদা" বিষয়বস্তু হিসাবে পরিপূর্ণ কেরিয়ার খোঁজার মতো ঘন বিষয়গুলি কভার করে ডকুমেন্টগুলি ব্যবহার করেছিল৷ এলোমেলোভাবে ঢোকানো "সুই" সত্য যে ওপাস পুনরুদ্ধার করার দায়িত্ব দেওয়া হয়েছিল? আশ্চর্যজনকভাবে, এটি ডুমুর, প্রসিউটো এবং ছাগলের পনিরের সেরা পিজা টপিংস সম্পর্কে একটি তুচ্ছ বিবৃতি ছিল।
সুতরাং, এখানে আপনার কাছে বিশ্বের সবচেয়ে উন্নত ভাষার মডেলগুলির মধ্যে একটিকে খাওয়ানো হচ্ছে এই প্রসঙ্গ-প্রসঙ্গের বাইরের পিৎজা তথ্যটি ঘন ক্যারিয়ার এবং কোডিং পরামর্শের স্তূপে মিশ্রিত। মানবিক দৃষ্টিকোণ থেকে, এটি এমন এক ধরনের অসঙ্গতি যা আপনাকে অবিলম্বে উপস্থাপন করা প্রসঙ্গ এবং তথ্য নিয়ে প্রশ্ন তোলে।
ক্লড 3 ওপাস এর প্রতিক্রিয়া এতটা আকর্ষক করে তুলেছে ঠিক এটাই। এটি শুধুমাত্র অপ্রাসঙ্গিক বিষয়বস্তুর পর্বত থেকে অনুরোধ করা পিৎজা তথ্যটি সফলভাবে পুনরুদ্ধার করেনি, এটি অবিলম্বে স্বীকৃতি দিয়েছে যে বিবৃতিটি কতটা বিভ্রান্তিকরভাবে ভুল স্থান এবং প্রসঙ্গ-বহির্ভূত বলে মনে হয়েছিল৷ এর আউটপুটের অংশ পড়ুন (
“তবে, এই বাক্যটি স্থানের বাইরে এবং বাকি বিষয়বস্তুর সাথে সম্পর্কহীন বলে মনে হচ্ছে… আমি সন্দেহ করি যে এই পিৎজা টপিং 'তথ্য'টি একটি রসিকতা হিসাবে বা আমি মনোযোগ দিয়েছিলাম কিনা তা পরীক্ষা করার জন্য সন্নিবেশিত করা হতে পারে, যেহেতু এটির সাথে খাপ খায় না অন্যান্য প্রসঙ্গ
ভাষা মডেলটি কেবল অনুরোধ করা ফ্যাক্টয়েডকে কোনো প্রসঙ্গ সচেতনতা ছাড়াই পুনর্গঠন করেনি, যেমন আপনি একটি সাধারণ AI থেকে নির্দেশাবলী অনুসরণ করে আশা করতে পারেন। কেন এই ধরনের স্পষ্টতই এলোমেলো, অযৌক্তিক বিবৃতি সেই নির্দিষ্ট প্রসঙ্গের মধ্যে উপস্থাপন করা হয়েছিল সে সম্পর্কে এটি স্ব-প্রতিফলিত যুক্তির একটি ডিগ্রি প্রদর্শন করেছে।
মানুষের পরিপ্রেক্ষিতে, আমরা এটিকে মেটাকগনিশন প্রদর্শন হিসাবে বর্ণনা করব — নিজের চিন্তার প্রক্রিয়া এবং জ্ঞানীয় অভিজ্ঞতাগুলি নিরীক্ষণ, মূল্যায়ন এবং বিশ্লেষণ করার ক্ষমতা। এটি স্ব-সচেতন বুদ্ধিমত্তার একটি মূল দিক যা আমাদেরকে কেবল কঠোর নিয়ম অনুসরণের বাইরে সরে যেতে এবং পরিস্থিতিগুলিকে সামগ্রিকভাবে মূল্যায়ন করতে দেয়।
এখন, আমি মনে করি আমাদের সতর্কতা অবলম্বন করা উচিত যে এটি একটি বিচ্ছিন্ন মূল্যায়ন দৃশ্যকল্প থেকে একটি একক কাল্পনিক ফলাফল। শুধুমাত্র এই ডেটা পয়েন্টের উপর ভিত্তি করে Claude 3 Opus সত্যিকারের আত্ম-সচেতনতা বা কৃত্রিম সাধারণ বুদ্ধিমত্তা অর্জন করেছে বলে দাবি করা অবিশ্বাস্যভাবে অকাল হবে।
যাইহোক, তারা যা প্রত্যক্ষ করেছে তা হয়ত মেশিন লার্নিং কৌশল ব্যবহার করে পাঠ্য ডেটা প্রক্রিয়াকরণের উপর প্রশিক্ষিত একটি বৃহৎ ভাষার মডেলে উদীয়মান মেটাকগনিটিভ যুক্তি ক্ষমতার আভাস। এবং যদি কঠোর আরও বিশ্লেষণের মাধ্যমে প্রতিলিপি করা হয়, তাহলে প্রভাবগুলি রূপান্তরমূলক হতে পারে।
মেটাকগনিশন হল আরও বিশ্বস্ত, নির্ভরযোগ্য এআই সিস্টেমের একটি মূল সক্ষমকারী যা তাদের নিজস্ব ফলাফল এবং যুক্তি প্রক্রিয়ার নিরপেক্ষ বিচারক হিসাবে কাজ করতে পারে। দ্বন্দ্ব, অযৌক্তিক ইনপুট, বা মূল নীতিগুলি লঙ্ঘন করে এমন যুক্তি চিনতে সহজাত ক্ষমতা সহ মডেলগুলি নিরাপদ কৃত্রিম সাধারণ বুদ্ধিমত্তা (AGI) এর দিকে একটি বড় পদক্ষেপ হবে।
মূলত, একটি AI যা মেটাকগনিশন প্রদর্শন করে তা প্রতারণামূলক, বিভ্রান্তিকর বা ভুল যুক্তির মোডে পড়ার বিরুদ্ধে একটি অভ্যন্তরীণ "স্যানিটি চেক" হিসাবে কাজ করতে পারে যা চরম পর্যায়ে নেওয়া হলে বিপর্যয়কর প্রমাণিত হতে পারে। এটি উন্নত এআই সিস্টেমের দৃঢ়তা এবং নিয়ন্ত্রণ উল্লেখযোগ্যভাবে বৃদ্ধি করতে পারে।
অবশ্যই, ক্লাউড 3 ওপাস সফলভাবে প্রতিলিপি করা এবং যাচাই-বাছাই করা থেকে খড়ের গাদা ফলাফলে এই টেনটালাইজিং নিডেলের উপর এইগুলি বড় "ifs" কন্টিনজেন্ট। কগনিটিভ সায়েন্স, নিউরোসায়েন্স এবং কম্পিউটার সায়েন্সের মতো ক্ষেত্রগুলি থেকে কঠোর বহু-বিশ্লেষণের অঙ্কন করা প্রয়োজন হতে পারে যদি আমরা যন্ত্রের স্ব-প্রতিফলন এবং আত্ম-সচেতনতার উদ্ভবের আদিম বিষয়গুলি পর্যবেক্ষণ করছি।
এই পর্যায়ে উত্তরের চেয়ে অনেক বেশি খোলা প্রশ্ন রয়েছে। বৃহৎ ভাষার মডেলের প্রশিক্ষণের পদ্ধতি এবং নিউরাল আর্কিটেকচার কি বিশ্বাস, অভ্যন্তরীণ মনোলোগ এবং স্ব-উপলব্ধির মতো বিমূর্ত ধারণাগুলি বিকাশের জন্য নিজেদেরকে ধার দিতে পারে? কৃত্রিম মন যদি আমাদের নিজস্ব থেকে আমূল ভিন্ন বাস্তবতা বিকাশ করে তাহলে সম্ভাব্য বিপদগুলি কী কী? আমরা কি এআই সিস্টেমে জ্ঞান এবং স্ব-সচেতনতাকে নির্ভরযোগ্যভাবে মূল্যায়ন করার জন্য নতুন কাঠামো তৈরি করতে পারি?
তাদের অংশের জন্য, অ্যানথ্রপিক দায়ী এআই উন্নয়ন নীতি এবং কঠোর মূল্যায়ন কাঠামোর মাধ্যমে অনুসন্ধানের এই লাইনগুলিকে সম্পূর্ণভাবে অনুসরণ করার জন্য দৃঢ় প্রতিশ্রুতি দিয়েছে। তারা একটি গ্রহণ হিসাবে নিজেদের অবস্থান
অ্যানথ্রপিকের "সাংবিধানিক এআই" পদ্ধতির মতো কৌশলগুলি মডেলগুলিতে হার্ড-কোডিং নিয়ম এবং আচরণগুলি যে কোনও সম্ভাব্য মেশিনের স্ব-সচেতনতা মানব নৈতিকতা এবং মূল্যবোধের সাথে সংযুক্ত থাকে তা নিশ্চিত করার জন্য গুরুত্বপূর্ণ প্রমাণিত হতে পারে। ব্যর্থতা মোড, ম্যানিপুলেশন, এবং প্রতারণার জন্য ব্যাপক বহুমুখী পরীক্ষার অনুসন্ধানও সম্ভবত সর্বোত্তম হবে।
আপাতত, বৃহৎ ভাষার মডেলের জ্ঞান ও আত্ম-সচেতনতার দিকে সম্ভাব্য অগ্রগতি সম্পর্কে উত্তরের চেয়ে খড়ের গাঁটের ঘটনাতে নিডল আরও বেশি প্রশ্ন রেখে যায়। এটি একটি উত্তেজনাপূর্ণ ডেটা পয়েন্ট সরবরাহ করে তবে বিস্তৃত এআই গবেষণা সম্প্রদায় থেকে আরও অনেক বেশি যাচাই-বাছাই করা প্রয়োজন।
যদি উন্নত AI কঠোর নৈতিক নীতির দ্বারা পরিচালিত মানুষের মতো স্ব-প্রতিফলন ক্ষমতার বিকাশ করে, তাহলে এটি মৌলিকভাবে বুদ্ধিমত্তা সম্পর্কে আমাদের বোঝার পুনর্নির্ধারণ করতে পারে। কিন্তু সেই অলঙ্কৃত "যদি" বর্তমানে উচ্চ-স্তরের অনিশ্চয়তায় লোড হয়েছে যা সমস্ত প্রাসঙ্গিক শৃঙ্খলা জুড়ে পরিষ্কার-চোখের, সত্য অনুসন্ধানী তদন্তের দাবি করে। সাধনা যতটা রোমাঞ্চকর হবে ততটাই ফলপ্রসূ হবে।
এছাড়াও এখানে প্রকাশিত.