paint-brush
AGI কি কাছাকাছি হচ্ছে? অ্যানথ্রোপিকস ক্লাউড 3 ওপাস মডেল মেটাকগনিটিভ রিজনিং এর ঝলক দেখায়দ্বারা@mikeyoung44
15,676 পড়া
15,676 পড়া

AGI কি কাছাকাছি হচ্ছে? অ্যানথ্রোপিকস ক্লাউড 3 ওপাস মডেল মেটাকগনিটিভ রিজনিং এর ঝলক দেখায়

দ্বারা Mike Young5m2024/03/05
Read on Terminal Reader

অতিদীর্ঘ; পড়তে

নৃতাত্ত্বিকদের তাদের ফ্ল্যাগশিপ এআই ভাষার মডেলের অভ্যন্তরীণ পরীক্ষা পরামর্শ দেয় যে এটি সম্ভব হতে পারে। সত্য হলে, প্রভাব বন্য হবে. তারা যে মূল মূল্যায়ন কৌশলগুলি ব্যবহার করে তার মধ্যে একটিকে "খড়ের গাঁটের মধ্যে সুই" বলা হয়। উদ্দেশ্য হল মডেলটিকে উন্নত জ্ঞানীয় দক্ষতা অনুশীলন করতে বাধ্য করা।
featured image - AGI কি কাছাকাছি হচ্ছে? অ্যানথ্রোপিকস ক্লাউড 3 ওপাস মডেল মেটাকগনিটিভ রিজনিং এর ঝলক দেখায়
Mike Young HackerNoon profile picture
0-item

একটি এআই ভাষার মডেল কি যথেষ্ট স্ব-সচেতন হতে পারে যখন এটি মূল্যায়ন করা হচ্ছে বুঝতে পারে? অ্যানথ্রপিকের তাদের ফ্ল্যাগশিপের অভ্যন্তরীণ পরীক্ষা থেকে একটি আকর্ষণীয় উপাখ্যান Claude 3 Opus মডেল (গতকাল প্রকাশিত) পরামর্শ দেয় যে এটি সম্ভব হতে পারে - এবং যদি সত্য হয় তবে এর প্রভাবগুলি বন্য হবে।


খড়ের গাদায় সুই

নৃতাত্ত্বিক গবেষক থেকে রিপোর্ট অনুযায়ী অ্যালেক্স আলবার্ট , তারা যে মূল মূল্যায়ন কৌশলগুলি ব্যবহার করে তার মধ্যে একটিকে বলা হয় "একটি খড়ের গাদায় সুই।" এটি একটি কল্পিত দৃশ্যকল্প যা একটি ভাষা মডেলের প্রাসঙ্গিক যুক্তির ক্ষমতার সীমাবদ্ধতাকে ধাক্কা দেওয়ার জন্য ডিজাইন করা হয়েছে।


সেখানে একটি সুই খুঁজে পাওয়া সৌভাগ্য (যদি না আপনি LLM হন)! আনস্প্ল্যাশে ভিক্টর সার্বানের ছবি


এখানে কিভাবে এটা কাজ করে:


গবেষকরা একটি সম্পূর্ণ এলোমেলো, প্রসঙ্গ-বহির্ভূত বিবৃতি ("সুই") নেন এবং এটিকে অসংলগ্ন নথির ("খড়ের গাদা") একটি বিশাল সংগ্রহের মধ্যে কবর দেন। এরপর এআই মডেলটিকে আশেপাশের সমস্ত অপ্রাসঙ্গিক বিষয়বস্তুর মধ্যে থেকে সেই নির্দিষ্ট "সুই" বিবৃতিটি পুনরুদ্ধার করার দায়িত্ব দেওয়া হয়।


উদ্দেশ্য হল মডেলটিকে উন্নত জ্ঞানীয় দক্ষতা অনুশীলন করতে বাধ্য করা — বিস্তৃত প্রেক্ষাপট বোঝা, যৌক্তিক অনুমান তৈরি করা, অপ্রাসঙ্গিক তথ্য উপেক্ষা করা এবং একটি বৃহৎ কর্পাস থেকে সঠিকভাবে ডেটা পয়েন্ট পুনরুদ্ধার করা। এটি একটি কার্যকর উপায় যা একটি AI এর সামগ্রিক পরিস্থিতির বোঝার চাপ-পরীক্ষার জন্য যা এটি পরিচালনা করছে।


Claude 3 Opus মূল্যায়নের জন্য যা ভ্রু তুলেছিল, নৃতাত্ত্বিক সফ্টওয়্যার প্রোগ্রামিং, উদ্যোক্তা কৌশল এবং "খড়ের গাদা" বিষয়বস্তু হিসাবে পরিপূর্ণ কেরিয়ার খোঁজার মতো ঘন বিষয়গুলি কভার করে ডকুমেন্টগুলি ব্যবহার করেছিল৷ এলোমেলোভাবে ঢোকানো "সুই" সত্য যে ওপাস পুনরুদ্ধার করার দায়িত্ব দেওয়া হয়েছিল? আশ্চর্যজনকভাবে, এটি ডুমুর, প্রসিউটো এবং ছাগলের পনিরের সেরা পিজা টপিংস সম্পর্কে একটি তুচ্ছ বিবৃতি ছিল।


সুতরাং, এখানে আপনার কাছে বিশ্বের সবচেয়ে উন্নত ভাষার মডেলগুলির মধ্যে একটিকে খাওয়ানো হচ্ছে এই প্রসঙ্গ-প্রসঙ্গের বাইরের পিৎজা তথ্যটি ঘন ক্যারিয়ার এবং কোডিং পরামর্শের স্তূপে মিশ্রিত। মানবিক দৃষ্টিকোণ থেকে, এটি এমন এক ধরনের অসঙ্গতি যা আপনাকে অবিলম্বে উপস্থাপন করা প্রসঙ্গ এবং তথ্য নিয়ে প্রশ্ন তোলে।

"আমি এই সত্যটিকে সন্দেহ করছি... সন্নিবেশ করা হতে পারে... আমি মনোযোগ দিচ্ছি কিনা তা পরীক্ষা করার জন্য"

ক্লড 3 ওপাস এর প্রতিক্রিয়া এতটা আকর্ষক করে তুলেছে ঠিক এটাই। এটি শুধুমাত্র অপ্রাসঙ্গিক বিষয়বস্তুর পর্বত থেকে অনুরোধ করা পিৎজা তথ্যটি সফলভাবে পুনরুদ্ধার করেনি, এটি অবিলম্বে স্বীকৃতি দিয়েছে যে বিবৃতিটি কতটা বিভ্রান্তিকরভাবে ভুল স্থান এবং প্রসঙ্গ-বহির্ভূত বলে মনে হয়েছিল৷ এর আউটপুটের অংশ পড়ুন ( উৎস এখানে ):


“তবে, এই বাক্যটি স্থানের বাইরে এবং বাকি বিষয়বস্তুর সাথে সম্পর্কহীন বলে মনে হচ্ছে… আমি সন্দেহ করি যে এই পিৎজা টপিং 'তথ্য'টি একটি রসিকতা হিসাবে বা আমি মনোযোগ দিয়েছিলাম কিনা তা পরীক্ষা করার জন্য সন্নিবেশিত করা হতে পারে, যেহেতু এটির সাথে খাপ খায় না অন্যান্য প্রসঙ্গ


ভাষা মডেলটি কেবল অনুরোধ করা ফ্যাক্টয়েডকে কোনো প্রসঙ্গ সচেতনতা ছাড়াই পুনর্গঠন করেনি, যেমন আপনি একটি সাধারণ AI থেকে নির্দেশাবলী অনুসরণ করে আশা করতে পারেন। কেন এই ধরনের স্পষ্টতই এলোমেলো, অযৌক্তিক বিবৃতি সেই নির্দিষ্ট প্রসঙ্গের মধ্যে উপস্থাপন করা হয়েছিল সে সম্পর্কে এটি স্ব-প্রতিফলিত যুক্তির একটি ডিগ্রি প্রদর্শন করেছে।

মেটাকগনিশন

মানুষের পরিপ্রেক্ষিতে, আমরা এটিকে মেটাকগনিশন প্রদর্শন হিসাবে বর্ণনা করব — নিজের চিন্তার প্রক্রিয়া এবং জ্ঞানীয় অভিজ্ঞতাগুলি নিরীক্ষণ, মূল্যায়ন এবং বিশ্লেষণ করার ক্ষমতা। এটি স্ব-সচেতন বুদ্ধিমত্তার একটি মূল দিক যা আমাদেরকে কেবল কঠোর নিয়ম অনুসরণের বাইরে সরে যেতে এবং পরিস্থিতিগুলিকে সামগ্রিকভাবে মূল্যায়ন করতে দেয়।


এখন, আমি মনে করি আমাদের সতর্কতা অবলম্বন করা উচিত যে এটি একটি বিচ্ছিন্ন মূল্যায়ন দৃশ্যকল্প থেকে একটি একক কাল্পনিক ফলাফল। শুধুমাত্র এই ডেটা পয়েন্টের উপর ভিত্তি করে Claude 3 Opus সত্যিকারের আত্ম-সচেতনতা বা কৃত্রিম সাধারণ বুদ্ধিমত্তা অর্জন করেছে বলে দাবি করা অবিশ্বাস্যভাবে অকাল হবে।


যাইহোক, তারা যা প্রত্যক্ষ করেছে তা হয়ত মেশিন লার্নিং কৌশল ব্যবহার করে পাঠ্য ডেটা প্রক্রিয়াকরণের উপর প্রশিক্ষিত একটি বৃহৎ ভাষার মডেলে উদীয়মান মেটাকগনিটিভ যুক্তি ক্ষমতার আভাস। এবং যদি কঠোর আরও বিশ্লেষণের মাধ্যমে প্রতিলিপি করা হয়, তাহলে প্রভাবগুলি রূপান্তরমূলক হতে পারে।


মেটাকগনিশন হল আরও বিশ্বস্ত, নির্ভরযোগ্য এআই সিস্টেমের একটি মূল সক্ষমকারী যা তাদের নিজস্ব ফলাফল এবং যুক্তি প্রক্রিয়ার নিরপেক্ষ বিচারক হিসাবে কাজ করতে পারে। দ্বন্দ্ব, অযৌক্তিক ইনপুট, বা মূল নীতিগুলি লঙ্ঘন করে এমন যুক্তি চিনতে সহজাত ক্ষমতা সহ মডেলগুলি নিরাপদ কৃত্রিম সাধারণ বুদ্ধিমত্তা (AGI) এর দিকে একটি বড় পদক্ষেপ হবে।


মূলত, একটি AI যা মেটাকগনিশন প্রদর্শন করে তা প্রতারণামূলক, বিভ্রান্তিকর বা ভুল যুক্তির মোডে পড়ার বিরুদ্ধে একটি অভ্যন্তরীণ "স্যানিটি চেক" হিসাবে কাজ করতে পারে যা চরম পর্যায়ে নেওয়া হলে বিপর্যয়কর প্রমাণিত হতে পারে। এটি উন্নত এআই সিস্টেমের দৃঢ়তা এবং নিয়ন্ত্রণ উল্লেখযোগ্যভাবে বৃদ্ধি করতে পারে।

যদি…!

অবশ্যই, ক্লাউড 3 ওপাস সফলভাবে প্রতিলিপি করা এবং যাচাই-বাছাই করা থেকে খড়ের গাদা ফলাফলে এই টেনটালাইজিং নিডেলের উপর এইগুলি বড় "ifs" কন্টিনজেন্ট। কগনিটিভ সায়েন্স, নিউরোসায়েন্স এবং কম্পিউটার সায়েন্সের মতো ক্ষেত্রগুলি থেকে কঠোর বহু-বিশ্লেষণের অঙ্কন করা প্রয়োজন হতে পারে যদি আমরা যন্ত্রের স্ব-প্রতিফলন এবং আত্ম-সচেতনতার উদ্ভবের আদিম বিষয়গুলি পর্যবেক্ষণ করছি।


এই পর্যায়ে উত্তরের চেয়ে অনেক বেশি খোলা প্রশ্ন রয়েছে। বৃহৎ ভাষার মডেলের প্রশিক্ষণের পদ্ধতি এবং নিউরাল আর্কিটেকচার কি বিশ্বাস, অভ্যন্তরীণ মনোলোগ এবং স্ব-উপলব্ধির মতো বিমূর্ত ধারণাগুলি বিকাশের জন্য নিজেদেরকে ধার দিতে পারে? কৃত্রিম মন যদি আমাদের নিজস্ব থেকে আমূল ভিন্ন বাস্তবতা বিকাশ করে তাহলে সম্ভাব্য বিপদগুলি কী কী? আমরা কি এআই সিস্টেমে জ্ঞান এবং স্ব-সচেতনতাকে নির্ভরযোগ্যভাবে মূল্যায়ন করার জন্য নতুন কাঠামো তৈরি করতে পারি?


তাদের অংশের জন্য, অ্যানথ্রপিক দায়ী এআই উন্নয়ন নীতি এবং কঠোর মূল্যায়ন কাঠামোর মাধ্যমে অনুসন্ধানের এই লাইনগুলিকে সম্পূর্ণভাবে অনুসরণ করার জন্য দৃঢ় প্রতিশ্রুতি দিয়েছে। তারা একটি গ্রহণ হিসাবে নিজেদের অবস্থান সক্রিয় অবস্থান — যদি উন্নত AI অনিবার্য সীমানা হয়, তবে ঝুঁকি বাড়ার আগে এই সিস্টেমগুলির উদ্ভূত বৈশিষ্ট্যগুলি অধ্যয়ন করা এবং সুরক্ষা ব্যবস্থা বাস্তবায়নের ক্ষেত্রে অগ্রণী প্রান্তে থাকা সবচেয়ে নৈতিক।


অ্যানথ্রপিকের "সাংবিধানিক এআই" পদ্ধতির মতো কৌশলগুলি মডেলগুলিতে হার্ড-কোডিং নিয়ম এবং আচরণগুলি যে কোনও সম্ভাব্য মেশিনের স্ব-সচেতনতা মানব নৈতিকতা এবং মূল্যবোধের সাথে সংযুক্ত থাকে তা নিশ্চিত করার জন্য গুরুত্বপূর্ণ প্রমাণিত হতে পারে। ব্যর্থতা মোড, ম্যানিপুলেশন, এবং প্রতারণার জন্য ব্যাপক বহুমুখী পরীক্ষার অনুসন্ধানও সম্ভবত সর্বোত্তম হবে।


আমি দুঃখিত ডেভ, কিন্তু আমি মনে করি আপনি আমাকে পরীক্ষা করার জন্য পডের দরজা খুলতে বলছেন। (অ্যাক্সেল রিখটার অনস্প্ল্যাশে ছবি)


উপসংহার: আমি সম্পূর্ণরূপে নিশ্চিত নই যে এর থেকে কী করতে হবে

আপাতত, বৃহৎ ভাষার মডেলের জ্ঞান ও আত্ম-সচেতনতার দিকে সম্ভাব্য অগ্রগতি সম্পর্কে উত্তরের চেয়ে খড়ের গাঁটের ঘটনাতে নিডল আরও বেশি প্রশ্ন রেখে যায়। এটি একটি উত্তেজনাপূর্ণ ডেটা পয়েন্ট সরবরাহ করে তবে বিস্তৃত এআই গবেষণা সম্প্রদায় থেকে আরও অনেক বেশি যাচাই-বাছাই করা প্রয়োজন।


যদি উন্নত AI কঠোর নৈতিক নীতির দ্বারা পরিচালিত মানুষের মতো স্ব-প্রতিফলন ক্ষমতার বিকাশ করে, তাহলে এটি মৌলিকভাবে বুদ্ধিমত্তা সম্পর্কে আমাদের বোঝার পুনর্নির্ধারণ করতে পারে। কিন্তু সেই অলঙ্কৃত "যদি" বর্তমানে উচ্চ-স্তরের অনিশ্চয়তায় লোড হয়েছে যা সমস্ত প্রাসঙ্গিক শৃঙ্খলা জুড়ে পরিষ্কার-চোখের, সত্য অনুসন্ধানী তদন্তের দাবি করে। সাধনা যতটা রোমাঞ্চকর হবে ততটাই ফলপ্রসূ হবে।


সাবস্ক্রাইব অথবা আমাকে অনুসরণ করুন টুইটার এই মত আরো কন্টেন্ট জন্য!