लेखक:
(1) मोहम्मद अल-स्मद, कतर विश्वविद्यालय, कतर और (ई-मेल: [email protected]).
शिक्षा में एआई के उपयोग का इतिहास
शिक्षा में एआई के उपयोग का इतिहास 1960 के दशक से शुरू होता है, जब शुरुआती बुद्धिमान शिक्षण प्रणालियों का विकास हुआ था। इन प्रणालियों को छात्रों को उनकी व्यक्तिगत आवश्यकताओं और सीखने की शैलियों के अनुरूप व्यक्तिगत निर्देश प्रदान करने के लिए डिज़ाइन किया गया था। हालाँकि, इससे पहले कि हम शिक्षा में जनरेटिव एआई के उपयोग के विकास में तल्लीन हों, हमें जनरेटिव एआई मॉडल के इतिहास और विकास को समझने की आवश्यकता है।
2.1. जनरेटिव एआई मॉडल का इतिहास और विकास
जनरेटिव आर्टिफिशियल इंटेलिजेंस (AI) मॉडल, विशेष रूप से भाषा मॉडल (LLM) ने पिछले कुछ वर्षों में उल्लेखनीय प्रगति देखी है, जिससे प्राकृतिक भाषा प्रसंस्करण और अन्य रचनात्मक कार्यों की एक विस्तृत श्रृंखला का परिदृश्य बदल गया है (सुसरला एट अल., 2023)। इस खंड में, हम इन मॉडलों की ऐतिहासिक जड़ों और विकासवादी प्रक्षेपवक्र में गहराई से उतरेंगे, और उन प्रमुख मील के पत्थरों पर प्रकाश डालेंगे जिन्होंने उनके विकास को आकार दिया है।
• भाषा मॉडलिंग के शुरुआती दिन: एलएलएम का विकास इतिहास 1950 और 1960 के दशक में सांख्यिकीय प्राकृतिक भाषा प्रसंस्करण (एनएलपी) के उद्भव के साथ शुरू हुआ। अपनी प्रारंभिक अवस्था में, भाषा मॉडल मुख्य रूप से भाषाई संदर्भ में किसी दिए गए शब्द या शब्द अनुक्रम की संभावना का अनुमान लगाने के लिए सांख्यिकीय पद्धतियों का उपयोग करते थे। इस अवधि के दौरान एन-ग्राम और एन शब्दों के अनुक्रम मौलिक तकनीक थे (रसेल और नॉरविग, 2010)।
• एन-ग्राम से वर्ड एम्बेडिंग तक: एन-ग्राम-आधारित मॉडल से वर्ड एम्बेडिंग के उपयोग की ओर एक महत्वपूर्ण बदलाव 2000 के दशक के मध्य में (मिकोलोव एट अल., 2013) द्वारा "वर्ड2वेक" एल्गोरिदम की शुरुआत के साथ उभरना शुरू हुआ। यह अभिनव दृष्टिकोण शब्दों के अर्थपूर्ण अर्थ को पकड़ने के लिए वेक्टर अभ्यावेदन के उपयोग पर टिका था। इस सफलता ने भाषा मॉडलिंग में बाद के विकास के लिए आधार तैयार किया।
• टेक्स्ट-आधारित डीप लर्निंग मॉडल (यानी सीक्वेंस-टू-सीक्वेंस एनएलपी) में प्रगति: भाषा मॉडलिंग में शब्द एम्बेडिंग के एकीकरण ने एक नए युग की शुरुआत की। ये वेक्टर अभ्यावेदन डीप लर्निंग मॉडल जैसे कि आवर्तक तंत्रिका नेटवर्क (आरएनएन) और बाद में, एनकोडर-डिकोडर आर्किटेक्चर के लिए इनपुट के रूप में काम करते थे। इस बदलाव का एनएलपी शोध पर गहरा प्रभाव पड़ा, जिसमें टेक्स्ट सारांश और मशीन अनुवाद शामिल है, जैसा कि (सुत्सकेवर एट अल., 2014) द्वारा प्रदर्शित किया गया है। वेक्टर अभ्यावेदन के माध्यम से अर्थपूर्ण संदर्भ को पकड़ने की क्षमता ने उत्पन्न सामग्री की गुणवत्ता और गहराई को काफी हद तक बढ़ाया।
• ट्रांसफॉर्मर आर्किटेक्चर क्रांति: 2017 में (वासवानी एट अल., 2017) द्वारा ट्रांसफॉर्मर आर्किटेक्चर की शुरूआत को एनएलपी और कंप्यूटर विज़न रिसर्च और विशेष रूप से भाषा मॉडलिंग रिसर्च की उन्नति में एक महत्वपूर्ण मोड़ माना जाता है। ट्रांसफॉर्मर आर्किटेक्चर ने सेल्फ-अटेंशन मैकेनिज्म की शुरुआत करके एनएलपी में एक प्रतिमान बदलाव का प्रतिनिधित्व किया। ट्रांसफॉर्मर आर्किटेक्चर के आधार पर कई डीप लर्निंग मॉडल विकसित किए गए हैं जैसे कि BERT (डेवलिन एट अल., 2018)। इस नवाचार ने मॉडल को अनुक्रमों के भीतर लंबी दूरी की निर्भरता को पकड़ने में सक्षम बनाया, जिससे उत्पन्न सामग्री की सुसंगतता और प्रासंगिकता में सुधार हुआ। ट्रांसफॉर्मर आर्किटेक्चर ने एलएलएम के बाद के विकास की नींव रखी।
• एलएलएम का उदय: हाल के वर्षों में, एआई के क्षेत्र में लार्ज लैंग्वेज मॉडल (एलएलएम) का प्रसार देखा गया है। इन मॉडलों को "फाउंडेशन मॉडल" शब्द से भी जाना जाता है, जिन्हें पुस्तकों, समाचार लेखों, वेब पेजों और सोशल मीडिया पोस्टों को शामिल करते हुए विशाल और विविध डेटासेट पर प्रशिक्षित किया जाता है और अरबों हाइपरपैरामीटर (बोम्मासानी एट अल., 2021) के साथ ट्यून किया जाता है। डेटा के इस अभूतपूर्व पैमाने ने मॉडल आर्किटेक्चर और प्रशिक्षण तकनीकों में प्रगति के साथ मिलकर एक महत्वपूर्ण मोड़ को चिह्नित किया। ये फाउंडेशन मॉडल कई तरह के कार्यों के लिए असाधारण अनुकूलनशीलता प्रदर्शित करते हैं, जिनमें वे कार्य भी शामिल हैं जिनके लिए उन्हें मूल रूप से प्रशिक्षित नहीं किया गया था। ChatGPT क्रियाशील जनरेटिव AI मॉडल का एक अनुकरणीय उदाहरण है। यह उल्लेखनीय AI सिस्टम नवंबर 2022 में लॉन्च किया गया था और इसे जनरेटिव प्री-ट्रेन्ड ट्रांसफॉर्मर GPT-3.5 से फाइन-ट्यून किया गया है, जिसे मूल रूप से टेक्स्ट और कोड स्रोतों के एक बड़े डेटासेट पर प्रशिक्षित किया गया था (नीलकंठन एट अल., 2022)। चैटजीपीटी ह्यूमन फीडबैक (आरएलएचएफ) से सुदृढीकरण सीखने की शक्ति का उपयोग करता है, एक ऐसी तकनीक जिसने बड़े भाषा मॉडल (एलएलएम) को मानवीय इरादे से जोड़ने में अपार संभावनाएं दिखाई हैं (क्रिस्टियानो एट अल., 2017)। चैटजीपीटी का आश्चर्यजनक रूप से बेहतर प्रदर्शन जनरेटिव एआई मॉडल के प्रशिक्षण में प्रतिमान बदलाव की संभावना को रेखांकित करता है। इस बदलाव में निर्देश संरेखण तकनीकों को अपनाना शामिल है, जैसे कि सुदृढीकरण सीखना (क्रिस्टियानो एट अल., 2017), प्रॉम्प्ट इंजीनियरिंग (ब्राउन एट अल., 2020), और चेन-ऑफ-थॉट (सीओटी) प्रॉम्प्ट (वेई एट अल., 2022), जो जनरेटिव एआई मॉडल पर आधारित बुद्धिमान सेवाओं के पारिस्थितिकी तंत्र के निर्माण की दिशा में एक सामूहिक कदम है।
इन प्रगतियों के परिणामस्वरूप जनरेटिव AI मॉडल सामने आए हैं, जिनमें मीडिया-समृद्ध यथार्थवादी और उचित सामग्री (जिसमें टेक्स्ट, चित्र, ऑडियो और वीडियो शामिल हैं) को समझने और उत्पन्न करने की उल्लेखनीय क्षमता है। ऐसी क्षमताओं ने इन मॉडलों को शिक्षा जैसे विभिन्न अनुप्रयोगों में उपयोग और व्यापक रूप से अपनाने में सक्षम बनाया है। इन प्रगतियों के बावजूद, जनरेटिव AI परिदृश्य में चिंताएँ और चुनौतियाँ उत्पन्न हुई हैं (सुसरला एट अल., 2023)। जिस आसानी से ChatGPT जैसे मॉडल को नए कार्यों के लिए अनुकूलित किया जा सकता है, वह उनकी समझ की गहराई के बारे में सवाल उठाता है। AI निष्पक्षता के विशेषज्ञों ने इन मॉडलों के प्रशिक्षण डेटा (ग्लेसर, 2023) में एन्कोड किए गए सामाजिक पूर्वाग्रहों को बनाए रखने की क्षमता के खिलाफ चेतावनी दी है, उन्हें "स्टोकेस्टिक तोते" (बेंडर एट अल., 2021) के रूप में लेबल किया है।
2.2. शिक्षा में जनरेटिव एआई के उपयोग का विकास
शिक्षा में एआई का उपयोग करना कोई नई बात नहीं है, शिक्षा में एआई के उपयोग के पहले प्रयासों को 1960 के दशक की शुरुआत में देखा जा सकता है, जब इलिनोइस विश्वविद्यालय के शोधकर्ताओं ने अर्बाना-शैंपेन में एक बुद्धिमान ट्यूटरिंग सिस्टम (ITS) विकसित किया था जिसे PLATO (प्रोग्राम्ड लॉजिक फॉर ऑटोमेटिक टीचिंग ऑपरेशंस) कहा जाता है (बिट्ज़र एट अल., 1961)। PLATO पहला कंप्यूटर सिस्टम था जिसने ग्राफिकल यूजर इंटरफेस वाले छात्रों को उन शैक्षिक सामग्रियों के साथ बातचीत करने में सक्षम बनाया जो उनकी ज़रूरतों के हिसाब से AI का उपयोग करके विकसित और अनुकूलित की गई थीं। शिक्षा में AI के उपयोग के शुरुआती प्रयासों का एक और उदाहरण "ऑटोमैटिक ग्रेडर" सिस्टम है जिसे 1960 के दशक में प्रोग्रामिंग कक्षाओं को स्वचालित रूप से ग्रेड करने के लिए विकसित किया गया था (हॉलिंग्सवर्थ, 1960)।
पर्सनल कंप्यूटर के आगमन ने 1970 के दशक के दौरान ITS के विकास को बढ़ाया है, उस अवधि में विकसित की गई एक प्रणाली का उदाहरण TICCIT (टाइम-शेयर्ड, इंटरएक्टिव कंप्यूटर-कंट्रोल्ड इंस्ट्रक्शनल टेलीविज़न) (स्टेटन, 1971) है। TICCIT एक और प्रारंभिक ITS था जिसे 1970 के दशक की शुरुआत में पिट्सबर्ग विश्वविद्यालय में विकसित किया गया था। TICCIT घरों और स्कूलों में उपयोगकर्ताओं को बड़े पैमाने पर व्यक्तिगत मल्टीमीडिया आधारित सामग्री वितरित करने का एक प्रारंभिक प्रयास था।
1960 और 1970 के दशक में आईटीएस के विकास में प्रगति को सीखने के सिद्धांतों और सिद्धांतों का समर्थन प्राप्त था, जो कक्षाओं में छात्रों के एक-से-एक व्यक्तिगत ट्यूशन को महत्व देते थे (उदाहरण के लिए बीएफ स्किनर के "प्रोग्राम्ड इंस्ट्रक्शन मूवमेंट" पर अग्रणी काम और बेंजामिन ब्लूम के "मास्टरी लर्निंग" पर काम देखें (ब्लॉक एंड बर्न्स, 1976)। उस अवधि के दौरान विकसित आईटीएस मुख्य रूप से नियम-आधारित प्रणालियां थीं। 1970 के दशक में एआई में प्रगति और माइक्रो-कंप्यूटर के आगमन ने आईटीएस को प्रशिक्षित और विकसित करने के तरीके को प्रभावित किया है (रीसर, 2001 ए)। 1980 के दशक से, कंप्यूटर आधारित निर्देश और विशेष रूप से एआई-आधारित शिक्षा का उपयोग कई अनुदेशात्मक गतिविधियों को स्वचालित करने के लिए विकसित हुआ है (रीसर, 2001 बी)।
1990 के दशक में वर्ल्ड-वाइड-वेब (WWW) के आगमन ने बुद्धिमान शैक्षिक सेवाओं के वितरण माध्यम में एक बड़ा बदलाव किया है चेन एट अल. (2020)। ITS मशीन लर्निंग मॉडल द्वारा समर्थित बुद्धिमान, अनुकूली और व्यक्तिगत शिक्षण सेवाएँ प्रदान करने के लिए विकसित हुए हैं। ITS के विकास और उपयोगकर्ताओं तक पहुँचाने के तरीके में इन प्रगति के बावजूद, उनकी क्षमताएँ व्यक्तिगत निर्देश और शिक्षण के वितरण तक ही सीमित थीं। WWW के तथाकथित "वेब 2.0" में विकास और सहयोगी और सामाजिक आधारित बातचीत की अतिरिक्त क्षमताओं ने ITS के विकास में एक नए युग का मार्ग प्रशस्त किया है। वेब 2.0 सेवाओं के साथ उपयोगकर्ताओं की बातचीत के आधार पर एकत्रित डेटा, और विभिन्न मशीन लर्निंग एल्गोरिदम का उपयोग करके इन डेटा पर सॉफ़्टवेयर एजेंटों को प्रशिक्षित करने की क्षमता ने सीखने के विश्लेषण के अनुप्रयोग में अनुकूलन और व्यक्तिगत सीखने के लिए और अधिक प्रगति की है (क्लो, 2013)।
21वीं सदी में शिक्षा में AI के उपयोग में कई सफलताएँ देखी गई हैं। इन सफलताओं को निम्नलिखित क्षेत्रों में हुई प्रगति द्वारा समर्थित किया गया: (i) हार्डवेयर क्षमताएँ और प्रदर्शन (निकोल्स और डैली, 2010), (ii) बिग डेटा माइनिंग (वू एट अल., 2013), और (iii) AI मॉडल और आर्किटेक्चर (यानी डीप लर्निंग मॉडल का आगमन) (लेकुन एट अल., 2015)। 2017 में ट्रांसफॉर्मर डीप लर्निंग आर्किटेक्चर का आगमन (वासवानी एट अल., 2017), सामान्य रूप से बुद्धिमान सॉफ़्टवेयर विकसित करने के इतिहास में एक महत्वपूर्ण मोड़ माना जाता है (अनुभाग 2.1 देखें)। इसके तुरंत बाद कई बुद्धिमान मॉडल जैसे कि जेनरेटिव प्री-ट्रेन्ड ट्रांसफॉर्मर (GPT) दिखाई देने लगे (रैडफ़ोर्ड एट अल., 2018)। नवंबर 2022 में, OpenAI ने ChatGPT जारी किया है - जो GPT 3.5 आर्किटेक्चर पर आधारित है - और कुछ ही महीनों में 100 मिलियन से अधिक उपयोगकर्ताओं तक पहुँच गया। तब से लेकर आज तक जनरेटिव एआई-आधारित शैक्षिक उपकरण छात्रों को वैयक्तिकृत निर्देश, अनुकूली शिक्षण और आकर्षक शिक्षण अनुभव प्रदान करने के लिए विकसित किए गए हैं (देखें अनुभाग 4.2)।