अपशॉट में जेनयांग, गीज़ा में फ्रैन, न्यूरोनेट्स में एशली, वैलेंस में मैट और पॉन्ड में डायलन द्वारा दिए गए बहुमूल्य इनपुट और फीडबैक के लिए धन्यवाद।
इस शोध का उद्देश्य एआई के उन महत्वपूर्ण क्षेत्रों को उजागर करना है जो इस क्षेत्र के डेवलपर्स के लिए प्रासंगिक हैं, तथा वेब3 और एआई प्रौद्योगिकियों के सम्मिलन में संभावित उभरते अवसरों का पता लगाना है।
एआई-केंद्रित विकेन्द्रीकृत अनुप्रयोगों (डीएपी) में वर्तमान प्रगति कई महत्वपूर्ण उपकरणों और अवधारणाओं पर प्रकाश डालती है:
वेब3 और एआई का फ्यूजन क्रिप्टो क्षेत्र में अत्यधिक रुचि पैदा कर रहा है क्योंकि डेवलपर्स क्रिप्टो डोमेन के लिए तैयार किए गए एआई इंफ्रास्ट्रक्चर का गहनता से पता लगा रहे हैं। इसका उद्देश्य स्मार्ट कॉन्ट्रैक्ट्स को परिष्कृत इंटेलिजेंस कार्यक्षमताओं से भरना है, जिसके लिए डेटा हैंडलिंग, मॉडल परिशुद्धता, कम्प्यूटेशनल आवश्यकताओं, परिनियोजन जटिलताओं और ब्लॉकचेन एकीकरण पर सावधानीपूर्वक ध्यान देने की आवश्यकता है।
वेब3 अग्रदूतों द्वारा तैयार किए गए प्रारंभिक समाधानों में शामिल हैं:
बढ़ते बुनियादी ढांचे के बावजूद, DApps में वास्तविक AI अनुप्रयोग सीमित है। आम ट्यूटोरियल केवल सतह को खरोंचते हैं, अक्सर फ्रंट-एंड वातावरण के भीतर बुनियादी OpenAI API इंटरैक्शन को दर्शाते हैं, बिना ब्लॉकचेन के विकेंद्रीकरण और सत्यापन की अनूठी पेशकशों का पूरी तरह से लाभ उठाए।
जैसे-जैसे परिदृश्य विकसित होता है, हम आने वाले महीनों में कई क्रिप्टो-नेटिव एआई अवसंरचनाओं के टेस्टनेट से पूर्ण परिचालन स्थिति में परिवर्तित होने के साथ महत्वपूर्ण विकास की आशा करते हैं।
इस गतिशील संदर्भ में, हमारा अन्वेषण क्रिप्टो-नेटिव एआई बुनियादी ढांचे में उपलब्ध उपकरणों के शस्त्रागार में गहराई से जाएगा, जो डेवलपर्स को क्रिप्टो के क्षेत्र में जीपीटी-3.5 जैसे महत्वपूर्ण प्रगति के लिए तैयार करेगा।
ओपनएआई के मजबूत मॉडल जैसे कि जीपीटी-4-विजन, जीपीटी-4-टर्बो और जीपीटी-4ओ का लाभ उठाने से अत्याधुनिक एआई डीएप्स विकसित करने का लक्ष्य रखने वालों को आकर्षक लाभ मिलते हैं। ये शक्तिशाली उपकरण तेजी से बढ़ते एआई x वेब3 परिदृश्य के भीतर उन्नत अनुप्रयोगों और समाधानों को आगे बढ़ाने के लिए आवश्यक आधारभूत क्षमताएँ प्रदान करते हैं।
ओपनएआई को विकेंद्रीकृत अनुप्रयोगों (डीएपी) में एकीकृत करना उन डेवलपर्स के बीच एक गर्म विषय है जो या तो ओरेकल या फ्रंटएंड से ओपनएआई एपीआई को कॉल कर सकते हैं। रेडपिल इस एकीकरण में सबसे आगे है, क्योंकि यह एक समेकित एपीआई सेवा की पेशकश करके शीर्ष एआई मॉडल तक पहुंच को लोकतांत्रिक बनाता है। यह सेवा विभिन्न ओपनएआई एपीआई योगदानों को जोड़ती है और उन्हें एक छत के नीचे प्रस्तुत करती है, जिससे ओपनएआई द्वारा आम तौर पर लगाए गए प्रतिबंधों के बिना बढ़ी हुई सामर्थ्य, बेहतर गति और व्यापक वैश्विक पहुंच जैसे लाभ मिलते हैं।
क्रिप्टोकरेंसी डेवलपर्स को अक्सर जिन अंतर्निहित समस्याओं का सामना करना पड़ता है, जैसे प्रति मिनट सीमित टोकन (TPM) या भौगोलिक सीमाओं के कारण प्रतिबंधित मॉडल एक्सेस, महत्वपूर्ण बाधाओं को जन्म दे सकते हैं। RedPill डेवलपर्स के अनुरोधों को उनके नेटवर्क के भीतर व्यक्तिगत योगदानकर्ताओं तक पहुंचाकर इन चिंताओं का सीधा समाधान करता है, जिससे OpenAI से किसी भी प्रत्यक्ष प्रतिबंध को प्रभावी ढंग से दरकिनार किया जा सकता है। नीचे दी गई तालिका RedPill और OpenAI के बीच क्षमताओं और लागतों में स्पष्ट अंतर को रेखांकित करती है:
| रेडपिल | ओपनएआई |
---|---|---|
टीपीएम | असीमित | अधिकांश उपयोगकर्ताओं के लिए 30k - 450k |
कीमत | प्रति 10 मिलियन अनुरोध पर $5 प्लस टोकन प्रोत्साहन | प्रति 10 मिलियन अनुरोध पर $5 |
RPM (प्रति मिनट अनुरोध) | असीमित | अधिकांश उपयोगकर्ताओं के लिए 500 - 5k |
OpenAI API का उपयोग करने के अलावा, डेवलपर्स अपने मॉडल को विकेंद्रीकृत GPU नेटवर्क पर होस्ट और चला सकते हैं। io.net , Aethir और Akash जैसे लोकप्रिय प्लेटफ़ॉर्म डेवलपर्स को अपने GPU क्लस्टर बनाने और प्रबंधित करने में सक्षम बनाते हैं, जिससे उन्हें सबसे प्रभावशाली मॉडल तैनात करने की अनुमति मिलती है - चाहे वे मालिकाना हों या ओपन-सोर्स।
ये विकेंद्रीकृत GPU नेटवर्क व्यक्तिगत योगदानकर्ताओं या छोटे डेटा केंद्रों से कंप्यूटिंग शक्ति का उपयोग करते हैं, जो विभिन्न प्रकार की मशीन विनिर्देशों, अधिक सर्वर स्थानों और कम लागतों को सुनिश्चित करता है। यह अनूठी संरचना डेवलपर्स को एक प्रबंधनीय बजट के भीतर महत्वाकांक्षी AI प्रयोगों का संचालन करने में सहायता करती है। हालाँकि, विकेंद्रीकृत प्रकृति के परिणामस्वरूप सीमित सुविधाएँ, अपटाइम विश्वसनीयता और डेटा गोपनीयता हो सकती है जैसा कि निम्नलिखित तुलना में दिखाया गया है:
| जीपीयू नेटवर्क | केंद्रीकृत GPU प्रदाता |
---|---|---|
एसएलए (अपटाइम) | चर | 99.99%+ |
एकीकरण और स्वचालन SDK | सीमित | उपलब्ध |
भंडारण सेवाएँ | सीमित | व्यापक (बैकअप, फ़ाइल, ऑब्जेक्ट, ब्लॉक भंडारण और पुनर्प्राप्ति रणनीतियाँ) |
डेटाबेस सेवाएँ | सीमित | व्यापक रूप से उपलब्ध |
पहचान और पहुँच प्रबंधन | सीमित | उपलब्ध |
फ़ायरवॉल | सीमित | उपलब्ध |
निगरानी/प्रबंधन/चेतावनी सेवाएँ | सीमित | उपलब्ध |
GDPR, CCPA (डेटा गोपनीयता) का अनुपालन | सीमित | आंशिक अनुपालन |
GPU नेटवर्क के प्रति रुचि में हाल ही में हुई वृद्धि ने बिटकॉइन माइनिंग के क्रेज को भी पीछे छोड़ दिया है। इस घटना में कुछ प्रमुख कारक योगदान करते हैं:
जैसे-जैसे एआई और विकेन्द्रीकृत कंप्यूटिंग का परिदृश्य विकसित होता जा रहा है, रेडपिल और विकेन्द्रीकृत जीपीयू नेटवर्क जैसे उपकरण डेवलपर्स द्वारा पारंपरिक बाधाओं को दूर करने और एआई विकास में नई संभावनाओं को खोलने के तरीके में क्रांतिकारी बदलाव ला रहे हैं।
अनुशंसा : io.net एक सीधा उपयोगकर्ता अनुभव प्रदान करता है जो विशेष रूप से Web2 डेवलपर्स के लिए उपयुक्त है। यदि आप अपने सेवा स्तर समझौतों (SLAs) के साथ लचीले हैं, तो io.net पर विचार करना एक बजट-अनुकूल विकल्प हो सकता है।
एक अनुमान नेटवर्क क्रिप्टो-नेटिव AI इंफ्रास्ट्रक्चर की रीढ़ बनाता है, जिसे डेटा को प्रोसेस करने और बुद्धिमान भविष्यवाणियां या निर्णय लेने में AI मॉडल का समर्थन करने के लिए डिज़ाइन किया गया है। भविष्य में, यह अरबों AI अनुमान संचालन को संभालने के लिए तैयार है। कई ब्लॉकचेन परतें (लेयर 1 या लेयर 2) पहले से ही डेवलपर्स को AI अनुमान संचालन को सीधे ऑन-चेन लागू करने की क्षमता प्रदान करती हैं। इस बाजार में अग्रणी में Ritual, Vanna और Fetch.ai जैसे प्लेटफ़ॉर्म शामिल हैं।
ये नेटवर्क कई कारकों के आधार पर भिन्न होते हैं, जिनमें प्रदर्शन (विलंब, गणना समय), समर्थित मॉडल, सत्यापन योग्यता और मूल्य (खपत और अनुमान लागत) के साथ-साथ समग्र डेवलपर अनुभव भी शामिल हैं।
आदर्श परिदृश्य में, डेवलपर्स को विभिन्न प्रमाणों के लिए व्यापक समर्थन और न्यूनतम एकीकरण प्रयास के साथ, किसी भी एप्लिकेशन में अनुकूलित AI अनुमान क्षमताओं को सहजता से एकीकृत करने में सक्षम होना चाहिए।
अनुमान नेटवर्क डेवलपर्स के लिए आवश्यक सभी बुनियादी ढांचे के तत्व प्रदान करता है, जैसे ऑन-डिमांड प्रूफ जनरेशन और सत्यापन, अनुमान गणना, अनुमान रिले, वेब 2 और वेब 3 एंडपॉइंट्स, वन-क्लिक मॉडल परिनियोजन, मॉनिटरिंग, क्रॉस-चेन इंटरऑपरेबिलिटी, एकीकरण सिंक्रनाइज़ेशन और अनुसूचित निष्पादन।
इन क्षमताओं के साथ, डेवलपर्स आसानी से अपने ब्लॉकचेन प्रोजेक्ट में अनुमान को एकीकृत कर सकते हैं। उदाहरण के लिए, विकेंद्रीकृत वित्त (DeFi) ट्रेडिंग बॉट विकसित करते समय, ट्रेडिंग जोड़े के लिए खरीद और बिक्री के अवसरों की पहचान करने और बेस DEX पर रणनीतियों को निष्पादित करने के लिए मशीन लर्निंग मॉडल का उपयोग किया जा सकता है।
आदर्श रूप से, सभी बुनियादी ढांचे को क्लाउड-होस्ट किया जाएगा, जिससे डेवलपर्स को टॉर्च जैसे लोकप्रिय प्रारूपों में अपनी मॉडल रणनीतियों को अपलोड और संग्रहीत करने की अनुमति मिलेगी। अनुमान नेटवर्क वेब2 और वेब3 क्वेरी के लिए मॉडल के भंडारण और सेवा दोनों को संभालेगा।
एक बार मॉडल परिनियोजन पूरा हो जाने के बाद, डेवलपर्स Web3 API अनुरोधों या सीधे स्मार्ट अनुबंधों के माध्यम से मॉडल अनुमान को ट्रिगर कर सकते हैं। अनुमान नेटवर्क लगातार ट्रेडिंग रणनीतियों को चलाता है और परिणामों को मूलभूत स्मार्ट अनुबंधों में वापस भेजता है। यदि पर्याप्त सामुदायिक निधियों का प्रबंधन करना है, तो अनुमान की सटीकता साबित करना आवश्यक हो सकता है। अनुमान परिणाम प्राप्त करने पर, स्मार्ट अनुबंध स्वचालित रूप से उन परिणामों के आधार पर ट्रेड निष्पादित करते हैं।
यद्यपि अतुल्यकालिक निष्पादन सैद्धांतिक रूप से बेहतर प्रदर्शन प्रदान कर सकता है, लेकिन यह डेवलपर अनुभव को जटिल बना सकता है।
एसिंक्रोनस मॉडल में, डेवलपर्स शुरू में स्मार्ट कॉन्ट्रैक्ट के माध्यम से इन्फ़रेंस नेटवर्क को अपना काम सबमिट करते हैं। एक बार जब काम पूरा हो जाता है, तो नेटवर्क का स्मार्ट कॉन्ट्रैक्ट परिणाम लौटाता है। यह प्रोग्रामिंग को दो चरणों में विभाजित करता है: इन्फ़रेंस को लागू करना और इसके परिणामों को संसाधित करना।
यह पृथक्करण जटिलताओं को जन्म दे सकता है, विशेष रूप से नेस्टेड इनफेरेंस कॉल या व्यापक तर्क प्रबंधन के साथ।
इसके अलावा, अतुल्यकालिक मॉडलों को मौजूदा स्मार्ट अनुबंधों के साथ एकीकृत करना चुनौतीपूर्ण हो सकता है, जिसके लिए अतिरिक्त कोडिंग, व्यापक त्रुटि प्रबंधन और अतिरिक्त निर्भरता की आवश्यकता होती है।
डेवलपर्स के लिए सिंक्रोनाइज़ेशन को लागू करना आम तौर पर ज़्यादा आसान होता है, लेकिन यह विलंबता और ब्लॉकचेन डिज़ाइन से जुड़ी चुनौतियों को पेश करता है। उदाहरण के लिए, ब्लॉक समय या बाज़ार की कीमतों जैसे तेज़ी से बदलते इनपुट डेटा से निपटने पर, प्रोसेसिंग पूरी होने तक डेटा पुराना हो सकता है। यह परिदृश्य स्मार्ट कॉन्ट्रैक्ट निष्पादन को रोलबैक करने का कारण बन सकता है, खासकर जब पुरानी कीमतों के आधार पर स्वैपिंग जैसे ऑपरेशन किए जाते हैं।
वैलेंस इन चुनौतियों से निपटने के लिए एसिंक्रोनस रूप से संचालित होने वाली एआई अवसंरचना पर ध्यान केंद्रित कर रहा है।
वर्तमान परिदृश्य में, रिचुअल नेटवर्क जैसे अधिकांश नए अनुमान नेटवर्क अभी भी परीक्षण चरणों से गुजर रहे हैं और उनके सार्वजनिक दस्तावेज़ीकरण के अनुसार सीमित कार्यक्षमता प्रदान करते हैं। ऑन-चेन एआई कंप्यूटेशन के लिए क्लाउड इंफ्रास्ट्रक्चर प्रदान करने के बजाय, वे स्वयं-होस्टिंग एआई कंप्यूटेशन के लिए एक फ्रेमवर्क का समर्थन करते हैं और बाद में ब्लॉकचेन को परिणाम रिले करते हैं।
AIGC NFT चलाने के लिए इस्तेमाल की जाने वाली एक सामान्य वास्तुकला इस प्रकार है: प्रसार मॉडल NFT उत्पन्न करता है और इसे Arweave पर अपलोड करता है। फिर अनुमान नेटवर्क Arweave पता प्राप्त करता है और NFT को ऑन-चेन बनाने के लिए आगे बढ़ता है।
इस मॉडल के लिए डेवलपर्स को अधिकांश बुनियादी ढांचे को स्वतंत्र रूप से तैनात और होस्ट करने की आवश्यकता होती है, जिसमें अनुकूलित सेवा तर्क, स्थिर प्रसार नोड्स और एनएफटी स्मार्ट अनुबंधों के साथ अनुष्ठान नोड्स का प्रबंधन करना शामिल है।
अनुशंसा : वर्तमान अनुमान नेटवर्क को एकीकृत करना और कस्टम मॉडल को तैनात करना जटिल है। चूंकि कई इस स्तर पर सत्यापन की पेशकश नहीं करते हैं, इसलिए फ्रंटएंड पर एआई को तैनात करना डेवलपर्स के लिए अधिक सरल विकल्प हो सकता है। सत्यापन की आवश्यकता वाले लोगों के लिए, जीरो नॉलेज मशीन लर्निंग प्रदाता, गीज़ा, एक आशाजनक विकल्प प्रदान करता है।
एजेंट नेटवर्क उपयोगकर्ताओं के लिए एजेंटों के अनुकूलन को सरल बनाते हैं। इन नेटवर्क में स्वायत्त संस्थाएँ या स्मार्ट अनुबंध शामिल होते हैं जो कार्यों को निष्पादित करने और एक दूसरे और ब्लॉकचेन के साथ स्वचालित रूप से बातचीत करने में सक्षम होते हैं। वे वर्तमान में बड़े भाषा मॉडल (LLM) पर अधिक ध्यान केंद्रित करते हैं, जैसे कि GPT चैटबॉट जो विशेष रूप से एथेरियम को समझने के लिए डिज़ाइन किए गए हैं। हालाँकि, ये चैटबॉट वर्तमान में अपनी क्षमताओं में सीमित हैं, जिससे डेवलपर्स को उनके ऊपर जटिल एप्लिकेशन बनाने से रोका जा सकता है।
भविष्य को देखते हुए, एजेंट नेटवर्क बाहरी API एक्सेस और निष्पादन कार्यक्षमताओं सहित उन्नत उपकरण प्रदान करके अपनी क्षमताओं को बढ़ाने के लिए तैयार हैं। डेवलपर्स कई विशेष एजेंटों को जोड़कर वर्कफ़्लो को ऑर्केस्ट्रेट करने में सक्षम होंगे - जैसे कि प्रोटोकॉल डिज़ाइन, सॉलिडिटी डेवलपमेंट, कोड सुरक्षा समीक्षा और अनुबंध परिनियोजन पर केंद्रित - सहयोग को सुविधाजनक बनाने के लिए संकेतों और संदर्भों का उपयोग करके।
एजेंट नेटवर्क के उदाहरणों में फ्लॉक.एआई , माईशेल और थियोरिक शामिल हैं।
अनुशंसा : चूंकि वर्तमान एजेंट प्रौद्योगिकियां अभी भी विकसित हो रही हैं और उनकी कार्यक्षमताएं सीमित हैं, इसलिए डेवलपर्स को वेब2 स्पेस में लैंगचेन या लामाइंडेक्स जैसे अधिक परिपक्व ऑर्केस्ट्रेशन टूल उनकी आवश्यकताओं के लिए अधिक प्रभावी लग सकते हैं।
जबकि एजेंट नेटवर्क और अनुमान नेटवर्क दोनों ही ब्लॉकचेन पर क्षमताओं और अंतःक्रियाओं को बढ़ाने का काम करते हैं, उनके मुख्य कार्य और परिचालन फ़ोकस बहुत अलग-अलग हैं। एजेंट नेटवर्क स्वचालित अंतःक्रियाओं और स्वायत्त एजेंटों के माध्यम से स्मार्ट अनुबंधों की उपयोगिता का विस्तार करने की दिशा में तैयार हैं। इसके विपरीत, अनुमान नेटवर्क मुख्य रूप से ब्लॉकचेन पर AI-संचालित डेटा विश्लेषणों को एकीकृत और प्रबंधित करने से संबंधित हैं। प्रत्येक ब्लॉकचेन और AI एकीकरण के विभिन्न पहलुओं के अनुरूप एक अद्वितीय उद्देश्य प्रदान करता है।
एजेंट नेटवर्क मुख्य रूप से बड़े भाषा मॉडल (एलएलएम) पर केंद्रित होते हैं और इन एजेंटों के एकीकरण को सुविधाजनक बनाने के लिए लैंगचेन जैसे ऑर्केस्ट्रेशन टूल प्रदान करते हैं। डेवलपर्स के लिए, इसका मतलब है कि उन्हें अपने मशीन लर्निंग मॉडल को स्क्रैच से विकसित करने की आवश्यकता नहीं है। इसके बजाय, मॉडल विकास और परिनियोजन की जटिलता को अनुमान नेटवर्क द्वारा दूर किया जाता है, जिससे उन्हें उपयुक्त टूल और संदर्भों का उपयोग करके एजेंटों को आसानी से जोड़ने की अनुमति मिलती है। अधिकांश मामलों में, अंतिम उपयोगकर्ता सीधे इन एजेंटों के साथ बातचीत करते हैं, जिससे उपयोगकर्ता अनुभव सरल हो जाता है।
इसके विपरीत, अनुमान नेटवर्क एजेंट नेटवर्क की परिचालन रीढ़ बनाता है, जो डेवलपर्स को निचले स्तर की पहुँच प्रदान करता है। एजेंट नेटवर्क के विपरीत, अनुमान नेटवर्क का उपयोग अंतिम उपयोगकर्ताओं द्वारा सीधे नहीं किया जाता है। डेवलपर्स को अपने मॉडल तैनात करने चाहिए - जो एलएलएम तक सीमित नहीं हैं - और वे इन मॉडलों को ऑफचेन या ऑनचेन पॉइंट के माध्यम से एक्सेस कर सकते हैं।
दिलचस्प बात यह है कि एजेंट नेटवर्क और अनुमान नेटवर्क कुछ मामलों में एक दूसरे से जुड़ने लगे हैं, और ऐसे ऊर्ध्वाधर एकीकृत उत्पाद उभर रहे हैं जो एजेंट और अनुमान दोनों तरह की कार्यक्षमताएं प्रदान करते हैं। यह एकीकरण तार्किक है क्योंकि दोनों फ़ंक्शन एक समान बुनियादी ढांचे की रीढ़ साझा करते हैं।
अनुमान और एजेंट नेटवर्क की तुलना:
| अनुमान नेटवर्क | एजेंट नेटवर्क |
---|---|---|
लक्षित ग्राहकों | डेवलपर्स | अंतिम उपयोगकर्ता/डेवलपर्स |
समर्थित मॉडल | एलएलएम, न्यूरल नेटवर्क, पारंपरिक एमएल मॉडल | मुख्यतः एलएलएम |
आधारभूत संरचना | विविध मॉडलों का समर्थन करता है | मुख्य रूप से लोकप्रिय एलएलएम का समर्थन करता है |
customizability | व्यापक मॉडल अनुकूलनशीलता | संकेतों और उपकरणों के माध्यम से कॉन्फ़िगर करने योग्य |
लोकप्रिय परियोजनाएं | अनुष्ठान, वैलेंस | फ्लॉक, माईशेल, थियोरिक, ओलास |
जैसे-जैसे हम मॉडल विकास पाइपलाइन में गहराई से उतरते हैं, वेब3 क्षेत्र में कई अवसर सामने आते हैं:
ऊर्ध्वाधर एकीकरण की ओर रुझान स्पष्ट है, जहां नेटवर्क एकल कम्प्यूटेशनल परत से व्यापक, बहु-कार्यात्मक एमएल समाधान प्रदान करना चाहते हैं। यह दृष्टिकोण वेब3 एमएल डेवलपर्स के लिए एक सुव्यवस्थित, ऑल-इन-वन समाधान का वादा करता है, जो एआई और ब्लॉकचेन प्रौद्योगिकियों के एकीकरण को आगे बढ़ाता है।
ऑन-चेन इंफ़रेंस, स्मार्ट कॉन्ट्रैक्ट जैसे बैकएंड सिस्टम के साथ असाधारण सत्यापन और सहज एकीकरण प्रदान करते हुए, महंगा और धीमा बना हुआ है। मैं भविष्य में एक हाइब्रिड दृष्टिकोण की कल्पना करता हूं। हम एक ऐसा मिश्रण देखने की संभावना रखते हैं जहाँ कुछ इंफ़रेंस कार्य दक्षता के लिए, फ्रंटएंड पर, ऑफचेन किए जाते हैं, जबकि महत्वपूर्ण, निर्णय-केंद्रित इंफ़रेंस कार्य ऑनचेन संभाले जाते रहेंगे। यह प्रतिमान पहले से ही मोबाइल उपकरणों के साथ व्यवहार में है। मोबाइल क्षमताओं का लाभ उठाते हुए, छोटे मॉडल त्वरित प्रतिक्रियाओं के लिए स्थानीय रूप से चलते हैं, जबकि अधिक जटिल गणनाएँ क्लाउड पर ऑफलोड की जाती हैं, जिससे बड़े भाषा मॉडल (LLM) का लाभ उठाया जाता है।