We publish the best academic work (that's too often lost to peer reviews & the TA's desk) to the global tech community
लेखक:
(1) रुहान झांग, कंप्यूटर विज्ञान विभाग, स्टैनफोर्ड विश्वविद्यालय, मानव-केंद्रित एआई संस्थान (एचएआई), स्टैनफोर्ड विश्वविद्यालय और समान रूप से योगदान दिया; zharu@stanford.edu;
(2) शेरोन ली, कंप्यूटर विज्ञान विभाग, स्टैनफोर्ड विश्वविद्यालय और समान रूप से योगदान दिया; zharu@stanford.edu;
(3) मिनजुन ह्वांग, कंप्यूटर विज्ञान विभाग, स्टैनफोर्ड विश्वविद्यालय और समान रूप से योगदान दिया; zharu@stanford.edu;
(4) अयानो हिरानाका, मैकेनिकल इंजीनियरिंग विभाग, स्टैनफोर्ड विश्वविद्यालय और समान रूप से योगदान दिया; zharu@stanford.edu;
(5) चेन वांग, कंप्यूटर विज्ञान विभाग, स्टैनफोर्ड विश्वविद्यालय;
(6) वेन्सी ऐ, कंप्यूटर विज्ञान विभाग, स्टैनफोर्ड विश्वविद्यालय;
(7) जिन जी रयान टैन, कंप्यूटर विज्ञान विभाग, स्टैनफोर्ड विश्वविद्यालय;
(8) श्रेया गुप्ता, कंप्यूटर विज्ञान विभाग, स्टैनफोर्ड विश्वविद्यालय;
(9) यिलुन हाओ, कंप्यूटर विज्ञान विभाग, स्टैनफोर्ड विश्वविद्यालय;
(10) रुहान गाओ, कंप्यूटर विज्ञान विभाग, स्टैनफोर्ड विश्वविद्यालय;
(11) एंथोनी नॉर्सिया, मनोविज्ञान विभाग, स्टैनफोर्ड विश्वविद्यालय
(12) ली फी-फी, 1 कंप्यूटर विज्ञान विभाग, स्टैनफोर्ड विश्वविद्यालय और मानव-केंद्रित एआई संस्थान (एचएआई), स्टैनफोर्ड विश्वविद्यालय;
(13) जियाजुन वू, कंप्यूटर विज्ञान विभाग, स्टैनफोर्ड विश्वविद्यालय और मानव-केंद्रित एआई संस्थान (एचएआई), स्टैनफोर्ड विश्वविद्यालय।
ब्रेन-रोबोट इंटरफ़ेस (बीआरआई): पृष्ठभूमि
निष्कर्ष, सीमाएँ और नैतिक चिंताएँ
परिशिष्ट 1: एनओआईआर के बारे में प्रश्न और उत्तर
परिशिष्ट 2: विभिन्न मस्तिष्क रिकॉर्डिंग उपकरणों के बीच तुलना
परिशिष्ट 5: प्रायोगिक प्रक्रिया
परिशिष्ट 6: डिकोडिंग एल्गोरिदम विवरण
परिशिष्ट 7: रोबोट लर्निंग एल्गोरिदम विवरण
हम न्यूरल सिग्नल ऑपरेटेड इंटेलिजेंट रोबोट (एनओआईआर) प्रस्तुत करते हैं, जो एक सामान्य-उद्देश्य, बुद्धिमान मस्तिष्क-रोबोट इंटरफ़ेस प्रणाली है जो मनुष्यों को मस्तिष्क संकेतों के माध्यम से रोजमर्रा की गतिविधियों को करने के लिए रोबोट को आदेश देने में सक्षम बनाती है। इस इंटरफ़ेस के माध्यम से, मनुष्य इलेक्ट्रोएन्सेफलोग्राफी (ईईजी) का उपयोग करके रोबोटों को अपनी रुचि की इच्छित वस्तुओं और कार्यों के बारे में बताते हैं। हमारी नवीन प्रणाली खाना पकाने, सफाई, व्यक्तिगत देखभाल और मनोरंजन सहित 20 चुनौतीपूर्ण, रोजमर्रा की घरेलू गतिविधियों की एक विस्तृत श्रृंखला में सफलता दर्शाती है। रोबोट लर्निंग एल्गोरिदम के सहक्रियात्मक एकीकरण से सिस्टम की प्रभावशीलता में सुधार हुआ है, जिससे एनओआईआर को व्यक्तिगत उपयोगकर्ताओं के अनुकूल होने और उनके इरादों की भविष्यवाणी करने की अनुमति मिलती है। हमारा काम मनुष्यों के रोबोट के साथ बातचीत करने के तरीके को बढ़ाता है, बातचीत के पारंपरिक चैनलों को प्रत्यक्ष, तंत्रिका संचार से बदल देता है। प्रोजेक्ट वेबसाइट: https://noir-corl.github.io/
कीवर्ड: ब्रेन-रोबोट इंटरफ़ेस; मानव-रोबोट संपर्क
चित्र 1: एनओआईआर एक सामान्य-उद्देश्यीय मस्तिष्क-रोबोट इंटरफ़ेस है जो मनुष्यों को अपने मस्तिष्क संकेतों का उपयोग करने की अनुमति देता है (1) दैनिक गतिविधियों को करने के लिए रोबोट को नियंत्रित करने के लिए, जैसे सुकियाकी बनाना (2), कपड़े इस्त्री करना (7), टिक-टैक खेलना -दोस्तों के साथ पैर की अंगुली (17), और एक रोबोट कुत्ते को सहलाना (21)।
ब्रेन-रोबोट इंटरफेस (बीआरआई) कला, विज्ञान और इंजीनियरिंग के क्षेत्र में एक शिखर उपलब्धि है। यह आकांक्षा, जो सट्टा कथा, नवीन कलाकृति और अभूतपूर्व वैज्ञानिक अध्ययनों में प्रमुखता से प्रदर्शित होती है, में ऐसे रोबोट सिस्टम बनाना शामिल है जो मनुष्यों के साथ सही तालमेल में काम करते हैं। ऐसी प्रणालियों का एक महत्वपूर्ण घटक मनुष्यों के साथ संवाद करने की उनकी क्षमता है। मानव-रोबोट सहयोग और रोबोट सीखने में, मनुष्य क्रियाओं के माध्यम से अपने इरादे संप्रेषित करते हैं [1], बटन दबाते हैं [2, 3], टकटकी लगाकर देखते हैं [4-7], चेहरे की अभिव्यक्ति [8], भाषा [9, 10], आदि [11 , 12]। हालाँकि, तंत्रिका संकेतों के माध्यम से सीधे संचार की संभावना सबसे रोमांचक लेकिन चुनौतीपूर्ण माध्यम है।
हम न्यूरल सिग्नल ऑपरेटेड इंटेलिजेंट रोबोट (एनओआईआर) प्रस्तुत करते हैं, जो गैर-इनवेसिव इलेक्ट्रोएन्सेफलोग्राफी (ईईजी) के साथ एक सामान्य प्रयोजन, बुद्धिमान बीआरआई प्रणाली है। इस प्रणाली का प्राथमिक सिद्धांत पदानुक्रमित साझा स्वायत्तता है, जहां मनुष्य उच्च-स्तरीय लक्ष्यों को परिभाषित करते हैं जबकि रोबोट निम्न-स्तरीय मोटर कमांड के निष्पादन के माध्यम से लक्ष्यों को साकार करता है। तंत्रिका विज्ञान, रोबोटिक्स और मशीन लर्निंग में प्रगति का लाभ उठाते हुए, हमारा सिस्टम निम्नलिखित योगदान देने के पिछले प्रयासों से आगे बढ़कर खुद को अलग करता है।
सबसे पहले, एनओआईआर अपने कार्यों और पहुंच की विविधता में सामान्य-उद्देश्यीय है। हम दिखाते हैं कि मनुष्य मौजूदा बीआरआई प्रणालियों के विपरीत 20 दैनिक दैनिक गतिविधियों की एक विस्तृत श्रृंखला को पूरा कर सकता है, जो आम तौर पर एक या कुछ कार्यों में विशिष्ट होती हैं या केवल सिमुलेशन में मौजूद होती हैं [13-22]। इसके अतिरिक्त, इस प्रणाली का उपयोग सामान्य आबादी द्वारा न्यूनतम प्रशिक्षण के साथ किया जा सकता है।
दूसरा, NOIR में "I" का अर्थ है कि हमारे रोबोट बुद्धिमान और अनुकूली हैं। रोबोट विविध कौशल के पुस्तकालय से सुसज्जित हैं, जो उन्हें गहन मानव पर्यवेक्षण के बिना निम्न-स्तरीय कार्य करने की अनुमति देता है। मानव व्यवहार संबंधी लक्ष्यों को स्वाभाविक रूप से पिक (ओबीजे-ए) या मूवटू (एक्स, वाई) जैसे पैरामीटरयुक्त आदिम कौशल वाले रोबोट द्वारा संप्रेषित, व्याख्या और निष्पादित किया जा सकता है। इसके अतिरिक्त, हमारे रोबोट अपने सहयोग के दौरान मानव इच्छित लक्ष्यों को सीखने में सक्षम हैं। हम दिखाते हैं कि फाउंडेशन मॉडल में हालिया प्रगति का लाभ उठाकर, हम सीमित डेटा के साथ ऐसी प्रणाली को अधिक अनुकूली बना सकते हैं। हम दिखाते हैं कि इससे सिस्टम की दक्षता में उल्लेखनीय वृद्धि हो सकती है।
एनओआईआर के प्रमुख तकनीकी योगदानों में मानव इरादों के लिए एक मॉड्यूलर न्यूरल सिग्नल डिकोडिंग पाइपलाइन शामिल है। तंत्रिका संकेतों से मानव इच्छित लक्ष्यों को डिकोड करना (उदाहरण के लिए, "हैंडल से मग उठाओ") बेहद चुनौतीपूर्ण है। हम मानव इरादे को तीन घटकों में विघटित करते हैं: किस वस्तु में हेरफेर करना है, वस्तु के साथ कैसे बातचीत करना है, और कहां बातचीत करना है, और दिखाते हैं कि ऐसे संकेतों को विभिन्न प्रकार के तंत्रिका डेटा से डिकोड किया जा सकता है। ये विघटित सिग्नल स्वाभाविक रूप से पैरामीटरयुक्त रोबोट कौशल के अनुरूप होते हैं और इन्हें रोबोट तक प्रभावी ढंग से संचारित किया जा सकता है।
टेबलटॉप या मोबाइल जोड़-तोड़ से जुड़ी 20 घरेलू गतिविधियों में, तीन मानव विषयों ने अपने मस्तिष्क संकेतों के साथ इन कार्यों को पूरा करने के लिए हमारे सिस्टम का सफलतापूर्वक उपयोग किया। हम प्रदर्शित करते हैं कि मनुष्यों से कुछ-शॉट रोबोट सीखने से हमारे सिस्टम की दक्षता में काफी सुधार हो सकता है। बुद्धिमान रोबोटिक प्रणालियों के निर्माण का यह दृष्टिकोण, जो सहयोग के लिए मानव मस्तिष्क संकेतों का उपयोग करता है, विकलांगता वाले या बिना विकलांग व्यक्तियों के लिए महत्वपूर्ण सहायक प्रौद्योगिकियों के विकास और उनके जीवन की गुणवत्ता में सुधार करने की अपार संभावनाएं रखता है।
यह पेपर CC 4.0 लाइसेंस के तहत arxiv पर उपलब्ध है।