লেখক:
(1) রুহান ঝাং, কম্পিউটার সায়েন্স বিভাগ, স্ট্যানফোর্ড ইউনিভার্সিটি, ইনস্টিটিউট ফর হিউম্যান-সেন্টারড এআই (এইচএআই), স্ট্যানফোর্ড ইউনিভার্সিটি এবং সমানভাবে অবদান; [email protected];
(2) শ্যারন লি, কম্পিউটার সায়েন্স বিভাগ, স্ট্যানফোর্ড বিশ্ববিদ্যালয় এবং সমানভাবে অবদান; [email protected];
(3) Minjune Hwang, কম্পিউটার সায়েন্স বিভাগ, স্ট্যানফোর্ড বিশ্ববিদ্যালয় এবং সমানভাবে অবদান; [email protected];
(4) আয়ানো হিরানাকা, মেকানিক্যাল ইঞ্জিনিয়ারিং বিভাগ, স্ট্যানফোর্ড বিশ্ববিদ্যালয় এবং সমানভাবে অবদান; [email protected];
(5) চেন ওয়াং, কম্পিউটার সায়েন্স বিভাগ, স্ট্যানফোর্ড বিশ্ববিদ্যালয়;
(6) ওয়েনসি আই, কম্পিউটার সায়েন্স বিভাগ, স্ট্যানফোর্ড ইউনিভার্সিটি;
(7) জিন জি রায়ান ট্যান, কম্পিউটার সায়েন্স বিভাগ, স্ট্যানফোর্ড বিশ্ববিদ্যালয়;
(8) শ্রেয়া গুপ্তা, কম্পিউটার সায়েন্স বিভাগ, স্ট্যানফোর্ড ইউনিভার্সিটি;
(9) ইলুন হাও, কম্পিউটার সায়েন্স বিভাগ, স্ট্যানফোর্ড বিশ্ববিদ্যালয়;
(10) রুওহান গাও, কম্পিউটার সায়েন্স বিভাগ, স্ট্যানফোর্ড বিশ্ববিদ্যালয়;
(11) অ্যান্টনি নরসিয়া, মনোবিজ্ঞান বিভাগ, স্ট্যানফোর্ড বিশ্ববিদ্যালয়
(12) লি ফেই-ফেই, 1 কম্পিউটার সায়েন্স বিভাগ, স্ট্যানফোর্ড ইউনিভার্সিটি এবং ইনস্টিটিউট ফর হিউম্যান-সেন্টারড এআই (এইচএআই), স্ট্যানফোর্ড ইউনিভার্সিটি;
(13) জিয়াজুন উ, কম্পিউটার সায়েন্স বিভাগ, স্ট্যানফোর্ড ইউনিভার্সিটি এবং ইনস্টিটিউট ফর হিউম্যান-সেন্টারড এআই (এইচএআই), স্ট্যানফোর্ড ইউনিভার্সিটি।
ব্রেইন-রোবট ইন্টারফেস (BRI): পটভূমি
উপসংহার, সীমাবদ্ধতা, এবং নৈতিক উদ্বেগ
পরিশিষ্ট 1: NOIR সম্পর্কে প্রশ্ন ও উত্তর
পরিশিষ্ট 2: বিভিন্ন ব্রেন রেকর্ডিং ডিভাইসের মধ্যে তুলনা
পরিশিষ্ট 5: পরীক্ষামূলক পদ্ধতি
পরিশিষ্ট 6: ডিকোডিং অ্যালগরিদম বিবরণ
পরিশিষ্ট 7: রোবট শেখার অ্যালগরিদমের বিবরণ
আমরা নিউরাল সিগন্যাল অপারেটেড ইন্টেলিজেন্ট রোবটস (NOIR), একটি সাধারণ-উদ্দেশ্য, বুদ্ধিমান ব্রেন-রোবট ইন্টারফেস সিস্টেম উপস্থাপন করি যা মানুষকে মস্তিষ্কের সংকেতের মাধ্যমে দৈনন্দিন ক্রিয়াকলাপ সম্পাদনের জন্য রোবটকে নির্দেশ দিতে সক্ষম করে। এই ইন্টারফেসের মাধ্যমে, মানুষ ইলেক্ট্রোএনসেফালোগ্রাফি (EEG) ব্যবহার করে রোবটদের কাছে তাদের আগ্রহের বস্তু এবং ক্রিয়াকলাপগুলিকে যোগাযোগ করে। আমাদের অভিনব সিস্টেম রান্না, পরিষ্কার, ব্যক্তিগত যত্ন এবং বিনোদন সহ 20টি চ্যালেঞ্জিং, দৈনন্দিন গৃহস্থালীর ক্রিয়াকলাপগুলির একটি বিস্তৃত অ্যারেতে সাফল্য প্রদর্শন করে৷ সিস্টেমের কার্যকারিতা রোবট শেখার অ্যালগরিদমের সমন্বয়সাধনের মাধ্যমে উন্নত হয়েছে, যা NOIR-কে স্বতন্ত্র ব্যবহারকারীদের সাথে খাপ খাইয়ে নিতে এবং তাদের উদ্দেশ্যের পূর্বাভাস দেওয়ার অনুমতি দেয়। আমাদের কাজ রোবটগুলির সাথে মানুষের যোগাযোগের উপায়কে উন্নত করে, প্রত্যক্ষ, স্নায়ু যোগাযোগের সাথে মিথস্ক্রিয়ার ঐতিহ্যবাহী চ্যানেলগুলিকে প্রতিস্থাপন করে। প্রকল্পের ওয়েবসাইট: https://noir-corl.github.io/
কীওয়ার্ড: ব্রেন-রোবট ইন্টারফেস; মানব-রোবট মিথস্ক্রিয়া
ব্রেইন-রোবট ইন্টারফেস (BRIs) শিল্প, বিজ্ঞান এবং প্রকৌশলের ক্ষেত্রে একটি সর্বোচ্চ কৃতিত্ব। এই উচ্চাকাঙ্ক্ষা, যা অনুমানমূলক কথাসাহিত্য, উদ্ভাবনী শিল্পকর্ম এবং যুগান্তকারী বৈজ্ঞানিক গবেষণায় বিশিষ্টভাবে বৈশিষ্ট্যযুক্ত, মানুষের সাথে নিখুঁত সমন্বয়ে কাজ করে এমন রোবোটিক সিস্টেম তৈরি করে। এই ধরনের সিস্টেমের একটি গুরুত্বপূর্ণ উপাদান হল মানুষের সাথে যোগাযোগ করার ক্ষমতা। মানব-রোবট সহযোগিতা এবং রোবট শেখার ক্ষেত্রে, মানুষ তাদের উদ্দেশ্যগুলিকে ক্রিয়া [1], বোতাম টিপে [2, 3], দৃষ্টি [4-7], মুখের অভিব্যক্তি [8], ভাষা [9, 10], ইত্যাদির মাধ্যমে যোগাযোগ করে। , 12]। যাইহোক, নিউরাল সিগন্যালের মাধ্যমে সরাসরি যোগাযোগের সম্ভাবনা সবচেয়ে রোমাঞ্চকর কিন্তু চ্যালেঞ্জিং মাধ্যম হিসেবে দাঁড়িয়েছে।
আমরা উপস্থাপন করি নিউরাল সিগন্যাল অপারেটেড ইন্টেলিজেন্ট রোবট (NOIR), একটি সাধারণ-উদ্দেশ্য, অ-আক্রমণকারী ইলেক্ট্রোএনসেফালোগ্রাফি (EEG) সহ বুদ্ধিমান BRI সিস্টেম। এই সিস্টেমের প্রাথমিক নীতি হল শ্রেণিবদ্ধ স্বায়ত্তশাসন, যেখানে মানুষ উচ্চ-স্তরের লক্ষ্যগুলি সংজ্ঞায়িত করে যখন রোবট নিম্ন-স্তরের মোটর কমান্ডগুলি সম্পাদনের মাধ্যমে লক্ষ্যগুলিকে বাস্তবায়িত করে। নিউরোসায়েন্স, রোবোটিক্স এবং মেশিন লার্নিং-এর অগ্রগতির সুবিধা গ্রহণ করে, আমাদের সিস্টেম নিম্নলিখিত অবদানগুলি করার পূর্ববর্তী প্রচেষ্টার বাইরে প্রসারিত করে নিজেকে আলাদা করে।
প্রথমত, NOIR এর কাজের বৈচিত্র্য এবং অ্যাক্সেসযোগ্যতার সাধারণ উদ্দেশ্য। আমরা দেখাই যে মানুষ 20টি দৈনন্দিন দৈনন্দিন কার্যকলাপের একটি বিস্তৃত অ্যারে সম্পন্ন করতে পারে, বিদ্যমান BRI সিস্টেমগুলির বিপরীতে যা সাধারণত এক বা কয়েকটি কাজে বিশেষায়িত হয় বা শুধুমাত্র সিমুলেশনে বিদ্যমান থাকে [13-22]। অতিরিক্তভাবে, ন্যূনতম পরিমাণ প্রশিক্ষণ সহ সাধারণ জনগণ এই সিস্টেমটি ব্যবহার করতে পারে।
দ্বিতীয়ত, NOIR-এ "I" এর অর্থ হল আমাদের রোবটগুলি বুদ্ধিমান এবং অভিযোজিত৷ রোবটগুলি বিভিন্ন দক্ষতার একটি লাইব্রেরি দিয়ে সজ্জিত, তাদের ঘন মানব তত্ত্বাবধান ছাড়াই নিম্ন-স্তরের ক্রিয়া সম্পাদন করতে দেয়। মানুষের আচরণগত লক্ষ্যগুলি স্বাভাবিকভাবেই প্যারামিটারাইজড আদিম দক্ষতা, যেমন Pick(obj-A) বা MoveTo(x,y) সহ রোবট দ্বারা যোগাযোগ, ব্যাখ্যা এবং কার্যকর করা যেতে পারে। উপরন্তু, আমাদের রোবটগুলি তাদের সহযোগিতার সময় মানুষের উদ্দিষ্ট লক্ষ্যগুলি শিখতে সক্ষম। আমরা দেখাই যে ফাউন্ডেশন মডেলগুলিতে সাম্প্রতিক অগ্রগতি লাভ করে, আমরা সীমিত ডেটার সাথে এই জাতীয় সিস্টেমকে আরও অভিযোজিত করতে পারি। আমরা দেখাই যে এটি উল্লেখযোগ্যভাবে সিস্টেমের দক্ষতা বৃদ্ধি করতে পারে।
NOIR-এর মূল প্রযুক্তিগত অবদানের মধ্যে রয়েছে মানুষের উদ্দেশ্যের জন্য একটি মডুলার নিউরাল সিগন্যাল ডিকোডিং পাইপলাইন। নিউরাল সিগন্যাল থেকে মানুষের উদ্দিষ্ট লক্ষ্যগুলি (যেমন, "হ্যান্ডেল থেকে মগ তোলা") ডিকোড করা অত্যন্ত চ্যালেঞ্জিং। আমরা মানুষের অভিপ্রায়কে তিনটি উপাদানে বিভক্ত করি: কোন বস্তুকে ম্যানিপুলেট করতে হবে, কীভাবে বস্তুর সাথে ইন্টারঅ্যাক্ট করতে হবে এবং কোথায় ইন্টারঅ্যাক্ট করতে হবে এবং দেখান যে এই ধরনের সংকেত বিভিন্ন ধরনের নিউরাল ডেটা থেকে ডিকোড করা যেতে পারে। এই পচনশীল সংকেতগুলি স্বাভাবিকভাবেই প্যারামিটারাইজড রোবট দক্ষতার সাথে মিলে যায় এবং রোবটগুলির সাথে কার্যকরভাবে যোগাযোগ করা যেতে পারে।
ট্যাবলেটপ বা মোবাইল ম্যানিপুলেশনের সাথে জড়িত 20টি পারিবারিক ক্রিয়াকলাপে, তিনটি মানব বিষয় তাদের মস্তিষ্কের সংকেতগুলির সাথে এই কাজগুলি সম্পন্ন করতে আমাদের সিস্টেমকে সফলভাবে ব্যবহার করেছে। আমরা দেখাই যে মানুষের কাছ থেকে কয়েক শট রোবট শেখা আমাদের সিস্টেমের কার্যকারিতা উল্লেখযোগ্যভাবে উন্নত করতে পারে। বুদ্ধিমান রোবোটিক সিস্টেম তৈরির এই পদ্ধতি, যা সহযোগিতার জন্য মানব মস্তিষ্কের সংকেত ব্যবহার করে, প্রতিবন্ধী বা বিহীন ব্যক্তিদের জন্য এবং তাদের জীবনের মান উন্নত করার জন্য সমালোচনামূলক সহায়ক প্রযুক্তির বিকাশের জন্য অপার সম্ভাবনা রাখে।
এই কাগজটি CC 4.0 লাইসেন্সের অধীনে arxiv-এ উপলব্ধ ।