কয়েক সপ্তাহ আগে, আমি ঘুরে দাঁড়িয়েছিলাম লক্ষ্যটি ছিল সহজ: তার আর্কিটেকচার বোঝা এবং দেখুন আমি কি শিখতে পারি এবং এর থেকে প্রয়োগ করতে পারি যখন আমি তার আর্কিটেকচারটি অনুসন্ধান করেছিলাম, মেমরি কাঠামো থেকে বিভিন্ন পরিষেবাগুলির সাথে এর ইন্টিগ্রেশন পর্যন্ত সবকিছু খুঁজে পেয়েছিলাম, আমি লক্ষ্য করতে পারিনি এটি আমাদের কাছে কতটা অনুরূপ মনে হয়েছে। ওপেনক্লাভ কোডব্যাগ এই নিবন্ধের মাধ্যমে আমার পর্যবেক্ষণগুলির উপর ভিত্তি করে আমার আশা করা হচ্ছে এবং শারীরিক বিশ্বের কিভাবে আমরা AI এর ভবিষ্যত সম্পর্কে কীভাবে ভাবি তা সম্পর্কে একটি নতুন দৃষ্টিভঙ্গি প্রদান করতে পারি। OpenClaw সম্পর্কিত OpenClaw সম্পর্কে অজানা ব্যক্তিদের জন্য, এটি একটি পোর্টেবল এআই এজেন্ট যা আপনার ব্যক্তিগত সহকারী হিসাবে পিটার স্টেইনবার্গার দ্বারা তৈরি এবং উন্মুক্ত সোর্স তৈরি করা হয়েছে. এটি যে কোনও কম্পিউটার বা সার্ভারে চলতে পারে এবং স্বয়ংক্রিয়ভাবে বিভিন্ন পরিষেবাগুলির সাথে ইন্টিগ্রেশন এবং বিভিন্ন কাজগুলি সম্পন্ন করতে কনফিগার করা যেতে পারে. আশ্চর্যজনকভাবে, ওপেনক্লাউভকে চিহ্নিত করার জন্য কোনও নতুন প্রযুক্তিগত অগ্রগতি ছিল না, বরং এটি কীভাবে একটি আইআই সিস্টেমকে ভাল শব্দগুলির অভাবের কারণে অনুভূত করতে সক্ষম হত: ইমেল এবং টেলিগ্রামের মতো বিভিন্ন সিস্টেমগুলির সাথে ইন্টিগ্রেশন, অতীতের কথোপকথনের তথ্য মনে রাখার জন্য দীর্ঘমেয়াদী মেমরি, বিভিন্ন ঘটনাগুলির প্রতিক্রিয়া করার জন্য একটি হৃদরোগ সিস্টেম, এবং আরও অনেক কিছু। ফলাফল হচ্ছে, একটি এআই এজেন্ট যা সায়েন্স ফিক্স চলচ্চিত্র থেকে স্যামান্তাকে ক্রমবর্ধমানভাবে কাছাকাছি অনুভব করে। . এখানে এখানে ভাগ্যবান প্রাথমিক OpenClaw এর সাথে আমার টাইমিংয়ের সময়, আমি এজেন্ট এবং আমাদের মধ্যে কয়েকটি পার্থক্য লক্ষ্য করেছি. যত বেশি আমি তার আর্কিটেকচারটি অনুসন্ধান করি, তত বেশি প্রতিটি দিক, এজেন্টটি গঠনের উপাদানগুলি থেকে তার চারপাশের পরিবেশে, কিছু পরিচিত মনে হতে শুরু করে। কিভাবে একটি পার্থক্য সঙ্গে বাস্তব বিশ্বের পাশাপাশি, এখানে ব্যতীত, শারীরিক এবং ডিজিটাল বিশ্বগুলি ক্রমবর্ধমান ভাবে একে অপরকে প্রতিফলিত করতে শুরু করে। অদ্ভুত জিনিস ওপাশের নিচে এটি দেখায় যে অনেক একই প্রাথমিক যা মানুষের কার্যকলাপ তৈরি করে এজেন্টগুলিতেও প্রদর্শিত হয়। Let me explain: চিন্তাভাবনা: একটি মানব মস্তিষ্কের এজেন্টের সমতুল্য একটি বড় ভাষা মডেল (এলএলএম)। তার বুদ্ধিমানের ক্ষমতা একটি এলএলএম (আমার ক্ষেত্রে, ক্লোড) এর সাথে সংযুক্ত হওয়ার কারণে আসে। যদিও মানুষের মস্তিষ্কগুলি শূন্য থেকে শুরু করে এবং অভিজ্ঞতার মাধ্যমে বিবেচনা পরিচালনা করার জন্য বিকাশ করে, এজেন্টগুলি তাদের সিদ্ধান্ত নেওয়ার জন্য অনেক পেটাবাইটের ডেটা উপর প্রাক প্রশিক্ষিত এলএলএম উপর নির্ভর করে, তাদের বুদ্ধিমানের একটি অংশ স্মৃতি দ্বারা সংরক্ষিত রিয়েল টাইম অভিজ্ঞতা দ্বারা প্রভাবিত হয়। এটা মনে করা অযৌক্তিক নয় যে নিকটবর্তী ভবিষ্যতে মেমরি: বিবেচনার বাইরে, আমি অন্য কিছু লক্ষ্য করেছি যা বেশ আকর্ষণীয় ছিল - এজেন্টটি দীর্ঘমেয়াদী স্মৃতিগুলি স্মরণ করতে সক্ষম ছিল, কিন্তু আরও কথোপকথন এবং স্মৃতিগুলির সাথে সেই ক্ষমতা দুর্বল হয়ে যায়; এটি আমাদের মধ্যে যারা এলএলএম এর প্রযুক্তিগত সীমাবদ্ধতাগুলির উপর গভীরভাবে সীমাবদ্ধ। খাদ্য: যেমন মানুষ বেঁচে থাকার এবং কাজ করার জন্য খাদ্য এবং পানি প্রয়োজন, এজেন্টদের কম্পিউটার প্রয়োজন. প্রতিটি পদক্ষেপ একটি এজেন্ট গ্রহণ কম্পিউটার সম্পদ, পাশাপাশি GPUs, বিদ্যুৎ, এবং শেষ পর্যন্ত অর্থ খরচ. অন্যভাবে বলা যায়, কম্পিউটার একটি এজেন্ট চিন্তা এবং কাজ করার ক্ষমতা বজায় রাখে জ্বালানি। হেল্টার: একটি এজেন্ট পরিচালনা করা সফ্টওয়্যার এমন কিছু মেশিনে বাস করে যা ইন্টারনেটে প্রদর্শিত হতে পারে অথবা হতে পারে না; যে মেশিনটি ছোট বা বড় হতে পারে এবং শুধুমাত্র একটি শারীরিক বিশ্বের একটি বাড়ির মতো নিজস্ব বৈশিষ্ট্যগুলি থাকতে পারে। এখন আপনি বলতে পারেন যে কম্পিউটারিংয়ের ক্ষেত্রে আমরা এই ধরনের "হোম" এর অনেক উদাহরণ স্থাপন করতে সক্ষম হই কিন্তু এই অনুরূপতার জন্য আমরা শুধুমাত্র সাধারণ ধারণাটি বিবেচনা করব যে একটি এজেন্ট কিছু হোস্ট মেশিনের ভিতরে থাকা উচিত। সরঞ্জাম এবং অবকাঠামো: যেমন মানুষ ফোনে, কম্পিউটার এবং গাড়ির মতো সরঞ্জাম ব্যবহার করে যোগাযোগ করতে, ন্যাভিগেশন করতে এবং শারীরিক বিশ্বের সাথে যোগাযোগ করতে, এজেন্টরা ইমেল, টেলিগ্রাম, এপিআই এবং অন্যান্য পরিষেবাগুলির মতো বাইরের সিস্টেমগুলির সাথে ইন্টিগ্রেশন উপর নির্ভর করে যোগাযোগ করতে, তথ্য পুনরুদ্ধার করতে এবং ডিজিটাল বিশ্বে তাদের নিজস্ব মৌলিক ইঞ্জিনের বাইরে কাজ করতে। আমি প্রথমে একই জিনিসটি ভেবেছিলাম, কিন্তু যত বেশি আমি তাদের সাথে বসে ছিলাম, তত বেশি আমি বুঝতে পেরেছি যে এর মানে ছিল যে আমরা শারীরিক বিশ্বের দিকে তাকিয়ে দেখতে পারি যা ডিজিটাল বিশ্বে পরবর্তী হতে পারে যেমন এটি বর্তমান AI আন্দোলনে প্রযোজ্য। স্বাধীন অভিনেত্রী হিসেবে এখন পর্যন্ত, আমি, অধিকাংশ লোকের মতো, সবসময় একটি নির্দিষ্ট লক্ষ্য অর্জনের জন্য ব্যবহৃত একটি অন্তর্ভুক্ত পরিবেশের মধ্যে একটি সরঞ্জাম বা বৈশিষ্ট্য হিসাবে "আইআই" দেখেছি. উদাহরণস্বরূপ, আইটি একটি ব্রাউজারে চ্যাটজিপিটি বা ক্লোডের মত একটি এলএলএম হিসাবে উপস্থিত হতে পারে যা ব্যবহারকারীদের দ্বারা জিজ্ঞাসিত প্রশ্নের উত্তর দেয়. এটি আপনার ইমেল প্রদানকারীর মধ্যে একটি বৈশিষ্ট্য হিসাবেও প্রদর্শিত হতে পারে, যা আপনাকে ইমেলগুলি আরও ভাল এবং দ্রুত নকশা করতে সহায়তা করে, বা একটি ব্যাংক প্ল্যাটফর্মের মধ্যে একটি সমর্থন এজেন্ট হিসাবে গ্রাহকদের জন্য সাহায্য ডেস্ক কিন্তু যখন আমি দেখলাম যে এজেন্টগুলি মানুষের সাথে কতটা অনুরূপ ছিল, তখন আমি জিজ্ঞাসা করতে শুরু করেছিলাম যে বিশ্ব যদি কেবল একটি অ্যাপ্লিকেশনের একটি বৈশিষ্ট্য বা অন্য কারো ইন্টারফেসে বসবাসকারী একটি সরঞ্জাম হিসাবে প্রয়োগ করা না হতো তাহলে এটি কী হতে পারে, কিন্তু তাদের নিজস্ব স্বাধীন নাগরিক হিসাবে ইন্টারনেটে, তাদের নিজস্ব (আইপি) ঠিকানা এবং ইন্টারনেটের মধ্যে ন্যাভিগেশন এবং অংশগ্রহণের ক্ষমতা দিয়ে। প্রশ্নগুলি "কেন না?", "এটা কিভাবে দেখতে পারে?", এবং ইন্টারনেট, তার বর্তমান আকারে, এই নতুন নাগরিকের জন্য প্রস্তুত ছিল কিনা। পরিচয়পত্রের প্রয়োজনীয়তা জন্মের সময় কাউকে নির্দিষ্ট করা প্রথম জিনিসগুলির মধ্যে একটি নাম, যা শারীরিক বিশ্বে অন্যদের দ্বারা আপনি কীভাবে স্বীকৃত এবং উল্লেখ করা হয় তার ভিত্তিতে পরিণত হয়। ইন্টারনেটের যুগে, ইন্টারনেটের মানুষ এবং সার্ভারগুলি একটি আলাদা সিস্টেম অনুসরণ করে, যা চুক্তিগুলি দ্বারা জড়িত যা আমরা প্রতিটি ব্যক্তির জন্য ডিজিটাল পরিচয় এবং ডিজিটাল ওয়ার্কবোর্ড হিসাবে বলা হয়। মানুষের ইমেল ঠিকানা, ব্যবহারকারীর নাম এবং অ্যাকাউন্ট রয়েছে যা আমাদের অনন্যভাবে সনাক্ত করতে দেয়। একই সময়ে, ওয়েব সার্ভার এবং অন্যান্য ডিজিটাল ওয়ার্কবোর্ডগুলি (ডিজিটাল) সার্টিফিকেটগুলি রয়েছে যা সত্যতা প্রমাণ করে যে আমরা যখন তাদের পরিদর্শন করি তখন আমরা প্রকৃতপক্ষে লক্ষ্যমাত্রার সাথে ইন্টারনেটের সাথে যোগাযোগ করি; এইভাবে আমরা জানি যে আমরা সঠিক ওয়েবসাইট আজকের ইন্টারনেট যুগের প্রসারিতে, আমি বিশ্বাস করি যে ইন্টারনেট ব্লকটিতে আমরা একটি নতুন অভিনেত্রীকে AI এজেন্ট বলে মনে করি। আমি এটি অভিনেতাদের একটি নতুন শ্রেণির হিসাবে দেখি কারণ এজেন্টদের একটি নতুন বৈশিষ্ট্য রয়েছে, যেখানে তারা অ-ডিটার্মিনিস্টিকভাবে আচরণ করে, অতীতের কোনও প্রোগ্রাম বা স্ক্রিপ্টের বিপরীতে। তাহলে এই বিষয়গুলোর কোনটি কেন হয়? সুতরাং যদি আমরা এজেন্টদেরকে ইন্টারনেটে নতুন ধরনের অভিনেত্রী হিসেবে বিবেচনা করি, তাহলে তাদের এতে অংশগ্রহণ করার জন্য তাদের কিছু ধরনের সনাক্তকরণ থাকতে হবে, কারণ ইন্টারনেটের স্থিতিশীলতা তার অংশগ্রহণকারীদের মধ্যে আস্থার উপর নির্ভর করে। অভাবনীয় পরিচয়, অভাবনীয় অবকাঠামো যেমন উল্লেখ করা হয়েছে, একটি পাসপোর্ট বা ড্রাইভার লাইসেন্সের মাধ্যমে পরিচয় আমাদের বিশ্বাস করতে এবং আমাদের চারপাশের সিস্টেমগুলির সাথে জড়িত হতে দেয়, এটি একটি ব্যাংক অ্যাকাউন্ট খুলতে, একটি চুক্তি স্বাক্ষর করতে, একটি কর্পোরেট বিল্ডিং অ্যাক্সেস করতে, বা শারীরিক বিশ্বে একটি কেনাকাটা করতে; এভাবে মানুষ জানে যে তারা কোনও নির্দিষ্ট সময়ে সঠিক ব্যক্তির সাথে কাজ করছে। যাইহোক, এজেন্টদের সাথে এটি ভেঙে যায় কারণ, যেমনটি প্রমাণিত হয়, ইন্টারনেটে এজেন্ট সনাক্তকরণের জন্য কোনও সম্মত সংজ্ঞা নেই, এবং এজেন্টের সনাক্তকরণটি আপনি মনে করতেন তেমন সহজ নয়। এটি ক্রমবর্ধমানভাবে গুরুত্বপূর্ণ হয়ে ওঠে যখন আপনি মাল্টি-অজেন্ট সিস্টেমগুলি বিবেচনা করেন এবং কিভাবে এজেন্ট বিভিন্ন পরিষেবা বা ওয়েবসাইটগুলির সাথে যোগাযোগ করতে পারেন যা, বিপরীতভাবে, অ-মানবের দ্বারা অ্যাক্সেস করা উচিত নয়, অন্তত তারা ভেবেছিলেন না (আরও দ্রুত এ বিষয়ে)। এজেন্টের কোন উপাদান(স)কে এজেন্ট পরিচয় সংজ্ঞায়িত করা উচিত? এটি কি ভিত্তিক মডেল, এটি সময়ের সাথে সাথে সংগৃহীত মেমরি, এটি চালিত হোস্ট মেশিন, বা এই তিনটির কোনও সংমিশ্রণ? যদি একটি হোস্ট মেশিনে দুটি এলএলএম সেশন চালানো হয়, তাহলে এটি একটি বা দুটি স্বাধীন পরিচয় বিবেচনা করা উচিত? আপনি কিভাবে উপরের প্রশ্নের উত্তর দিতে পারেন, সনাক্তকরণ অঞ্চলে অবশ্যই অনেক কাজ করতে হবে, এবং আমি নিশ্চিত যে সঠিক উত্তরগুলি প্রয়োজন হবে। ইন্টারনেটের অংশগ্রহণকারীরা (মানুষ ও এজেন্ট উভয়ই) এবং বড় কোম্পানিগুলি একটি অপ্টিমাইজেশান সমাধানের জন্য একসঙ্গে কাজ করে। ইন্টারনেট ইঞ্জিনিয়ারিং টাস্ক ফোর্স (IETF) পরিচিতি ছাড়াও, এজেন্টগুলি Gmail, Slack, বা এমনকি Salesforce এর মতো ওয়েবসাইট এবং পরিষেবাগুলির সাথে যোগাযোগ করতে সক্ষম হতে হবে যদি আমরা এজেন্টগুলি বিক্রয় টিমের সহকর্মী হওয়ার পরিকল্পনা করি; তারা ইন্টারনেটে পরিষেবাগুলির জন্য অর্থ প্রদান করতে পারে। এটি দেখায় যে এজেন্টদের পরিষেবাগুলির সাথে ইন্টারেক্টর করতে সক্ষম করা (অপার্টমাইজডভাবে) আপনি মনে করতেন যতটা সহজ নয় এবং, ইন্টারনেটকে আরও AI-রূপে আধুনিক করার জন্য আকর্ষণীয় প্রকৌশল উন্নয়ন চলছে যদিও , আমি বিশ্বাস করি এই অনন্য প্রোটোকলটি আরও অনেকগুলির মধ্যে একটি, এটি একটি বৃহত্তর কাঠামোগত পরিবর্তন প্রতিনিধিত্ব করে যা একটি আইটি-পরিবর্তিত ভবিষ্যৎ সক্ষম করতে হবে। "বোট" যেমন আমরা তাদের ডাকছি, সেবা অ্যাক্সেস থেকে প্রতিরোধ করা প্রমাণ করে। এমপিপি ক্যাপচা বাস্তবতা হল যে ইন্টারনেট, তার পরিবেশগত সিস্টেমের ফর্ম এবং ফ্যাক্টর, ব্রাউজার সহ, মানুষের জন্য ডিজাইন করা হয়েছিল। কিভাবে ওয়েবসাইট ব্রাউজার অভিজ্ঞতা এবং এজেন্ট অভিজ্ঞতা জন্য অপ্টিমাইজ করা হয়; একজন এমনকি জিজ্ঞাসা করতে পারেন যে এজেন্টগুলি ইন্টারনেট ব্রাউজারের জন্য কোনও ব্রাউজার প্রয়োজন কিনা বা আমরা এজেন্টদের জন্য ইন্টারনেটটি ডিজাইন করা হয়নি তা প্রতিরোধ করার জন্য ভার্চুয়াল ব্রাউজারগুলি চালু করছি কিনা। ওয়েব ডিজাইন, পণ্য ডিজাইন এবং UI / UX কতটা মানুষের জন্য ওয়েবসাইট এবং অ্যাপ্লিকেশনের অপ্টিমাইজেশান ঘুরে। ইন্টারনেটের মাধ্যমে কিভাবে অর্থ প্রদান করা হয় সাধারণত মানুষের দ্বারা করা হয় এবং ভার্চুয়াল ব্রাউজারে শারীরিক বিশ্ব থেকে ক্রেডিট কার্ডের তথ্য প্রবেশ করে। কিভাবে ইন্টারনেটে পরিষেবাগুলির অ্যাক্সেস প্রায়ই ব্যবহারকারীদের সাথে জড়িত এপিআই কীগুলির মাধ্যমে করা হয়; কেউ প্রশ্ন করতে পারে কেন এজেন্টরা তাদের নিজস্ব "সার্ভিস" অ্যাকাউন্টগুলি গ্রহণ করার পরিবর্তে এই পরিষেবাটির জন্য অনন্য পরিচিতিগুলির সাথে ব্যবহারকারীদের পক্ষে কাজ করতে হবে। মোটামুটি, এটা আমার কাছে স্পষ্ট যে ইন্টারনেটটি এজেন্টদের মনোযোগ দিয়ে তৈরি করা হয়নি এবং উভয় টিউব, ভিত্তিক প্রাক্তন এবং প্রোটোকলগুলি যা ইন্টারনেটকে শক্তি দেয়, তার অংশগ্রহণকারীদের সাথে, বিভিন্ন পরিষেবা সরবরাহ করে ওয়েবসাইটগুলি, উভয় মানুষের এবং এজেন্টগুলির জন্য পরিবর্তন করতে হবে। সুযোগী ভবিষ্যৎ একটি সুযোগী ভবিষ্যতের চাবিকাঠি ইন্টারনেটে স্বাধীন অভিনেত্রী হওয়ার লেন্সের মাধ্যমে এজেন্টগুলি দেখতে হবে. একবার আপনি এটি করতে শুরু করেন, আপনি অনেক আকর্ষণীয় প্রশ্ন জিজ্ঞাসা করতে শুরু করবেন: যখন এজেন্টগুলি ইন্টারনেটে কাজ করে, পরিচয় রাখে, লেনদেন করে এবং অন্যান্য সিস্টেমগুলির সাথে যোগাযোগ করে? সত্যি বলতে গেলে, যেসব প্রাথমিকগুলি আমরা আজ বিশ্বাস করি, যার মধ্যে পরিচয়, সনাক্তকরণ, অনুমোদন এবং সিস্টেম ইন্টারফেস রয়েছে, তারা মানুষের জন্য এবং নির্ধারিত কাজের লোডগুলির জন্য ডিজাইন করা হয়েছিল। আপনি যদি এই লেখাটি পড়েন, তাহলে বর্তমান ইন্টারনেট অবকাঠামোতে গঠনগত ঘাটতিগুলি নিয়ে চিন্তা করার জন্য সময় ব্যয় করার যোগ্য, কারণ এটি সম্ভবত নতুন সিস্টেম এবং সুযোগগুলি নতুন বিশ্বের প্রথম শ্রেণীর অংশগ্রহণকারী হয়ে উঠবে।