लेखक:
(1) रुहान झांग, कंप्यूटर विज्ञान विभाग, स्टैनफोर्ड विश्वविद्यालय, मानव-केंद्रित एआई संस्थान (एचएआई), स्टैनफोर्ड विश्वविद्यालय और समान रूप से योगदान दिया; [email protected];
(2) शेरोन ली, कंप्यूटर विज्ञान विभाग, स्टैनफोर्ड विश्वविद्यालय और समान रूप से योगदान दिया; [email protected];
(3) मिनजुन ह्वांग, कंप्यूटर विज्ञान विभाग, स्टैनफोर्ड विश्वविद्यालय और समान रूप से योगदान दिया; [email protected];
(4) अयानो हिरानाका, मैकेनिकल इंजीनियरिंग विभाग, स्टैनफोर्ड विश्वविद्यालय और समान रूप से योगदान दिया; [email protected];
(5) चेन वांग, कंप्यूटर विज्ञान विभाग, स्टैनफोर्ड विश्वविद्यालय;
(6) वेन्सी ऐ, कंप्यूटर विज्ञान विभाग, स्टैनफोर्ड विश्वविद्यालय;
(7) जिन जी रयान टैन, कंप्यूटर विज्ञान विभाग, स्टैनफोर्ड विश्वविद्यालय;
(8) श्रेया गुप्ता, कंप्यूटर विज्ञान विभाग, स्टैनफोर्ड विश्वविद्यालय;
(9) यिलुन हाओ, कंप्यूटर विज्ञान विभाग, स्टैनफोर्ड विश्वविद्यालय;
(10) रुहान गाओ, कंप्यूटर विज्ञान विभाग, स्टैनफोर्ड विश्वविद्यालय;
(11) एंथोनी नॉर्सिया, मनोविज्ञान विभाग, स्टैनफोर्ड विश्वविद्यालय
(12) ली फी-फी, 1 कंप्यूटर विज्ञान विभाग, स्टैनफोर्ड विश्वविद्यालय और मानव-केंद्रित एआई संस्थान (एचएआई), स्टैनफोर्ड विश्वविद्यालय;
(13) जियाजुन वू, कंप्यूटर विज्ञान विभाग, स्टैनफोर्ड विश्वविद्यालय और मानव-केंद्रित एआई संस्थान (एचएआई), स्टैनफोर्ड विश्वविद्यालय।
ब्रेन-रोबोट इंटरफ़ेस (बीआरआई): पृष्ठभूमि
निष्कर्ष, सीमाएँ और नैतिक चिंताएँ
परिशिष्ट 1: एनओआईआर के बारे में प्रश्न और उत्तर
परिशिष्ट 2: विभिन्न मस्तिष्क रिकॉर्डिंग उपकरणों के बीच तुलना
परिशिष्ट 5: प्रायोगिक प्रक्रिया
परिशिष्ट 6: डिकोडिंग एल्गोरिदम विवरण
परिशिष्ट 7: रोबोट लर्निंग एल्गोरिदम विवरण
हम न्यूरल सिग्नल ऑपरेटेड इंटेलिजेंट रोबोट (एनओआईआर) प्रस्तुत करते हैं, जो एक सामान्य-उद्देश्य, बुद्धिमान मस्तिष्क-रोबोट इंटरफ़ेस प्रणाली है जो मनुष्यों को मस्तिष्क संकेतों के माध्यम से रोजमर्रा की गतिविधियों को करने के लिए रोबोट को आदेश देने में सक्षम बनाती है। इस इंटरफ़ेस के माध्यम से, मनुष्य इलेक्ट्रोएन्सेफलोग्राफी (ईईजी) का उपयोग करके रोबोटों को अपनी रुचि की इच्छित वस्तुओं और कार्यों के बारे में बताते हैं। हमारी नवीन प्रणाली खाना पकाने, सफाई, व्यक्तिगत देखभाल और मनोरंजन सहित 20 चुनौतीपूर्ण, रोजमर्रा की घरेलू गतिविधियों की एक विस्तृत श्रृंखला में सफलता दर्शाती है। रोबोट लर्निंग एल्गोरिदम के सहक्रियात्मक एकीकरण से सिस्टम की प्रभावशीलता में सुधार हुआ है, जिससे एनओआईआर को व्यक्तिगत उपयोगकर्ताओं के अनुकूल होने और उनके इरादों की भविष्यवाणी करने की अनुमति मिलती है। हमारा काम मनुष्यों के रोबोट के साथ बातचीत करने के तरीके को बढ़ाता है, बातचीत के पारंपरिक चैनलों को प्रत्यक्ष, तंत्रिका संचार से बदल देता है। प्रोजेक्ट वेबसाइट: https://noir-corl.github.io/
कीवर्ड: ब्रेन-रोबोट इंटरफ़ेस; मानव-रोबोट संपर्क
ब्रेन-रोबोट इंटरफेस (बीआरआई) कला, विज्ञान और इंजीनियरिंग के क्षेत्र में एक शिखर उपलब्धि है। यह आकांक्षा, जो सट्टा कथा, नवीन कलाकृति और अभूतपूर्व वैज्ञानिक अध्ययनों में प्रमुखता से प्रदर्शित होती है, में ऐसे रोबोट सिस्टम बनाना शामिल है जो मनुष्यों के साथ सही तालमेल में काम करते हैं। ऐसी प्रणालियों का एक महत्वपूर्ण घटक मनुष्यों के साथ संवाद करने की उनकी क्षमता है। मानव-रोबोट सहयोग और रोबोट सीखने में, मनुष्य क्रियाओं के माध्यम से अपने इरादे संप्रेषित करते हैं [1], बटन दबाते हैं [2, 3], टकटकी लगाकर देखते हैं [4-7], चेहरे की अभिव्यक्ति [8], भाषा [9, 10], आदि [11 , 12]। हालाँकि, तंत्रिका संकेतों के माध्यम से सीधे संचार की संभावना सबसे रोमांचक लेकिन चुनौतीपूर्ण माध्यम है।
हम न्यूरल सिग्नल ऑपरेटेड इंटेलिजेंट रोबोट (एनओआईआर) प्रस्तुत करते हैं, जो गैर-इनवेसिव इलेक्ट्रोएन्सेफलोग्राफी (ईईजी) के साथ एक सामान्य प्रयोजन, बुद्धिमान बीआरआई प्रणाली है। इस प्रणाली का प्राथमिक सिद्धांत पदानुक्रमित साझा स्वायत्तता है, जहां मनुष्य उच्च-स्तरीय लक्ष्यों को परिभाषित करते हैं जबकि रोबोट निम्न-स्तरीय मोटर कमांड के निष्पादन के माध्यम से लक्ष्यों को साकार करता है। तंत्रिका विज्ञान, रोबोटिक्स और मशीन लर्निंग में प्रगति का लाभ उठाते हुए, हमारा सिस्टम निम्नलिखित योगदान देने के पिछले प्रयासों से आगे बढ़कर खुद को अलग करता है।
सबसे पहले, एनओआईआर अपने कार्यों और पहुंच की विविधता में सामान्य-उद्देश्यीय है। हम दिखाते हैं कि मनुष्य मौजूदा बीआरआई प्रणालियों के विपरीत 20 दैनिक दैनिक गतिविधियों की एक विस्तृत श्रृंखला को पूरा कर सकता है, जो आम तौर पर एक या कुछ कार्यों में विशिष्ट होती हैं या केवल सिमुलेशन में मौजूद होती हैं [13-22]। इसके अतिरिक्त, इस प्रणाली का उपयोग सामान्य आबादी द्वारा न्यूनतम प्रशिक्षण के साथ किया जा सकता है।
दूसरा, NOIR में "I" का अर्थ है कि हमारे रोबोट बुद्धिमान और अनुकूली हैं। रोबोट विविध कौशल के पुस्तकालय से सुसज्जित हैं, जो उन्हें गहन मानव पर्यवेक्षण के बिना निम्न-स्तरीय कार्य करने की अनुमति देता है। मानव व्यवहार संबंधी लक्ष्यों को स्वाभाविक रूप से पिक (ओबीजे-ए) या मूवटू (एक्स, वाई) जैसे पैरामीटरयुक्त आदिम कौशल वाले रोबोट द्वारा संप्रेषित, व्याख्या और निष्पादित किया जा सकता है। इसके अतिरिक्त, हमारे रोबोट अपने सहयोग के दौरान मानव इच्छित लक्ष्यों को सीखने में सक्षम हैं। हम दिखाते हैं कि फाउंडेशन मॉडल में हालिया प्रगति का लाभ उठाकर, हम सीमित डेटा के साथ ऐसी प्रणाली को अधिक अनुकूली बना सकते हैं। हम दिखाते हैं कि इससे सिस्टम की दक्षता में उल्लेखनीय वृद्धि हो सकती है।
एनओआईआर के प्रमुख तकनीकी योगदानों में मानव इरादों के लिए एक मॉड्यूलर न्यूरल सिग्नल डिकोडिंग पाइपलाइन शामिल है। तंत्रिका संकेतों से मानव इच्छित लक्ष्यों को डिकोड करना (उदाहरण के लिए, "हैंडल से मग उठाओ") बेहद चुनौतीपूर्ण है। हम मानव इरादे को तीन घटकों में विघटित करते हैं: किस वस्तु में हेरफेर करना है, वस्तु के साथ कैसे बातचीत करना है, और कहां बातचीत करना है, और दिखाते हैं कि ऐसे संकेतों को विभिन्न प्रकार के तंत्रिका डेटा से डिकोड किया जा सकता है। ये विघटित सिग्नल स्वाभाविक रूप से पैरामीटरयुक्त रोबोट कौशल के अनुरूप होते हैं और इन्हें रोबोट तक प्रभावी ढंग से संचारित किया जा सकता है।
टेबलटॉप या मोबाइल जोड़-तोड़ से जुड़ी 20 घरेलू गतिविधियों में, तीन मानव विषयों ने अपने मस्तिष्क संकेतों के साथ इन कार्यों को पूरा करने के लिए हमारे सिस्टम का सफलतापूर्वक उपयोग किया। हम प्रदर्शित करते हैं कि मनुष्यों से कुछ-शॉट रोबोट सीखने से हमारे सिस्टम की दक्षता में काफी सुधार हो सकता है। बुद्धिमान रोबोटिक प्रणालियों के निर्माण का यह दृष्टिकोण, जो सहयोग के लिए मानव मस्तिष्क संकेतों का उपयोग करता है, विकलांगता वाले या बिना विकलांग व्यक्तियों के लिए महत्वपूर्ण सहायक प्रौद्योगिकियों के विकास और उनके जीवन की गुणवत्ता में सुधार करने की अपार संभावनाएं रखता है।
यह पेपर CC 4.0 लाइसेंस के तहत arxiv पर उपलब्ध है।