जानें कि कैसे ChatGPT के साथ एक चर्चा CassIO में बदल गई, Apache Cassandra उपयोगकर्ताओं के लिए एक अद्भुत पुस्तकालय।
यदि आप चैटजीपीटी के लगातार उपयोगकर्ता हैं, तो आप जानते हैं कि इसके भटकने की प्रवृत्ति को मतिभ्रम के रूप में जाना जाता है। सांख्यिकीय रूप से सही शब्दों का एक बड़ा संग्रह जिसका वास्तविकता में कोई आधार नहीं है। कुछ महीने पहले, बड़े भाषा मॉडल (एलएलएम) और लैंगचैन के लिए अपाचे कैसेंड्रा का उपयोग करने के बारे में एक जिज्ञासु प्रतिक्रिया हुई। ChatGPT ने बताया कि एलएलएम बनाते समय न केवल कैसेंड्रा एक अच्छा उपकरण विकल्प था, OpenAI ने कैसेंड्रा का उपयोग MIT-लाइसेंस प्राप्त पायथन लाइब्रेरी के साथ किया जिसे उन्होंने CassIO कहा।
खरगोश के छेद में हम गए, और अधिक उत्साह के माध्यम से, चैटजीपीटी ने कैसियो का उपयोग करने के तरीके के बारे में कई विवरणों का वर्णन किया। इसमें कुछ नमूना कोड और एक वेबसाइट भी शामिल थी। बाद के शोध में चैटजीपीटी प्रतिक्रियाओं के बाहर कैसियो का कोई सबूत नहीं मिला, लेकिन बीज बोया गया था। यदि यह पुस्तकालय मौजूद नहीं था, तो इसकी आवश्यकता थी और हमने शीघ्र ही इस पर काम करना शुरू कर दिया।
सबसे अच्छा मतिभ्रम।
क्या असली कैसियो कृपया खड़ा होगा?
यह महान विचार क्या था जिससे ChatGPT (और, एसोसिएशन द्वारा, OpenAI) प्रेरित हुआ? एक महान पायथन पुस्तकालय डेवलपर्स को कम से अधिक करने में सक्षम बनाता है। डेटास्टैक्स और अनंत ने विकास में संयुक्त बल दियाकेसियो जनरेटिव आर्टिफिशियल इंटेलिजेंस और अन्य मशीन लर्निंग वर्कलोड के साथ कैसेंड्रा के एकीकरण को सहज बनाने के लिए। इसका मुख्य उद्देश्य इसके सहित कैसेंड्रा डेटाबेस तक पहुँचने की प्रक्रिया को अमूर्त करना हैवेक्टर खोज क्षमताएं, रेडी-टू-यूज़ टूल का एक सेट पेश करती हैं जो अतिरिक्त कोड की आवश्यकता को कम करता है। नतीजतन, डेवलपर्स अपने एआई सिस्टम को डिजाइन और कार्यान्वित करने पर ध्यान केंद्रित कर सकते हैं, यह जानते हुए कि कैसियो ने अंतर्निहित डेटाबेस जटिलताओं का ख्याल रखा है। परिणाम किफायती पैमाने और कम विलंबता के लिए एक सिद्ध डेटाबेस तक पहुंच है। कैसियो का सार कार्यान्वयन प्रक्रिया को सुविधाजनक बनाने और सरल बनाने के बारे में है।
कैसियो की ताकत विशिष्ट एआई ढांचे के प्रति इसके अज्ञेयवाद में निहित है। यह इंटरफेस के विशिष्ट कार्यान्वयन विवरण के साथ खुद को चिंतित नहीं करता हैलैंगचैन ,लामाइंडेक्स ,माइक्रोसॉफ्ट सिमेंटिक कर्नेल , या विभिन्न अन्य जनरेटिव AI टूलकिट। इसके बजाय, यह "थिन एडेप्टर" का एक सेट प्रदान करता है जो कैसियो की क्षमताओं का उपयोग करते समय फ्रेमवर्क के इंटरफेस के अनुरूप होता है। यह CassIO को आपके AI एप्लिकेशन और डेटाबेस के बीच की खाई को पाटने में सक्षम बनाता है, इस प्रकार एप्लिकेशन को इसके विवरण में उलझे बिना कैसेंड्रा की शक्ति का लाभ उठाने में सक्षम बनाता है।
लैंगचैन के साथ एकीकरण
लैंगचैन अधिकांश प्रबंधन कार्यों और एलएलएम के साथ बातचीत को स्वचालित करता है। यह स्मृति, सदिश-आधारित समानता खोज, उन्नत शीघ्र टेंपलेटिंग अमूर्तता, और अन्य सुविधाओं के धन के लिए समर्थन प्रदान करता है। CassIO LangChain के साथ मूल रूप से एकीकृत करता है, कैसेंड्रा-विशिष्ट उपकरणों को विस्तारित करता है जैसे कि कार्यों को कारगर बनाने के लिए:
एलएलएम के लिए एक मेमोरी मॉड्यूल जो स्टोरेज के लिए कैसेंड्रा का उपयोग करता है, जो चैट इंटरेक्शन में हाल के एक्सचेंजों को याद रख सकता है, या यहां तक कि पूरी पिछली बातचीत का सारांश भी रख सकता है।
कैसेंड्रा पर एलएलएम प्रतिक्रियाओं को कैश करने की सुविधा, जिससे जहां संभव हो विलंबता और टोकन की बचत होती है। कैसेंड्रा से डेटा का एक संकेत या लंबी एलएलएम बातचीत में स्वचालित इंजेक्शन।
भविष्य की आपूर्ति के लिए अनिर्दिष्ट कुछ इनपुट छोड़कर संकेतों के "आंशिककरण" के लिए समर्थन।
ये घटक डेटा को संकेतों में शामिल करने की प्रक्रिया को कारगर बनाने के लिए एक साथ काम करते हैं और एलएलएम और डेटाबेस के बीच सहज संपर्क सुनिश्चित करते हैं।
वेक्टर खोज के साथ एकीकरण
का समावेशवेक्टर खोज कैसंड्रा और डेटास्टैक्स एस्ट्रा डीबी में क्षमताओं ने हाल ही में लेन-देन डेटा के लिए पहले से ही लोकप्रिय डेटाबेस में एक प्रमुख विशेषता को एकीकृत किया है। उच्च स्तर के लिए कैसंड्रा की प्रतिष्ठा का मतलब है कि आपके पास महंगे संचालन में डेटा को स्थानांतरित किए बिना डेटा को संग्रहीत और संसाधित करने के लिए एक ही स्थान है। सदिश खोज के जुड़ने से कैसियो में उपलब्ध "सिमेंटिकली अवेयर" टूलिंग के एक सूट के लिए दरवाजे खुल गए हैं, जैसे:
एलएलएम प्रतिक्रियाओं का कैश जो किसी क्वेरी के सटीक वाक्यांश पर निर्भर नहीं हैं।
एक "सिमेंटिक इंडेक्स" जो ज्ञान के आधार को संग्रहीत कर सकता है और किसी दिए गए प्रश्न का सर्वोत्तम उत्तर बनाने के लिए प्रासंगिक भागों को पुनः प्राप्त कर सकता है। इस उपकरण को कई विशिष्ट आवश्यकताओं के अनुरूप अनुकूलित किया जा सकता है और उत्तर में बहने वाली वास्तविक जानकारी को अधिकतम करने के लिए विविध जानकारी प्राप्त करने के लिए कॉन्फ़िगर किया जा सकता है।
एलएलएम चैट इंटरैक्शन के लिए एक "सिमेंटिक मेमोरी" तत्व, जो दूर के अतीत में होने पर भी प्रासंगिक पिछले एक्सचेंजों को पुनः प्राप्त कर सकता है।
CassIO और LangChain का संयोजन एलएलएम प्रबंधन की निरंतर विकसित होने वाली जरूरतों को पूरा करने के लिए समय के साथ इन क्षमताओं का विस्तार और परिशोधन जारी रखता है। वर्तमान अत्याधुनिक एलएलएम से अधिक सटीक प्रतिक्रिया प्राप्त करने के लिए श्रृंखलाबद्ध संकेतों में है। हाल ही के एक पेपर में एक तकनीक का वर्णन किया गया हैवृक्ष का विचार , सदिश खोज की भूमिका एक प्रांप्ट से अगले प्रांप्ट तक बने रहने में महत्वपूर्ण भूमिका निभाती है। चूंकि ये विचार शिक्षा से उत्पादन की ओर बढ़ते हैं, कैसेंड्रा कार्यान्वयन के एक महत्वपूर्ण हिस्से के रूप में काम करेगा।
अगला संकेत: कैसियो के लिए आगे क्या है
एक विकासशील उपकरण के रूप में, कैसियो तेजी से बढ़ रहा है, जिसमें नए विकास और अपडेट अक्सर जोड़े जाते हैं। लेखन के समय, Cassio LangChain का समर्थन करता है, LlamaIndex जल्द ही आ रहा है। इस परियोजना का दीर्घकालिक लक्ष्य स्वायत्त एआई एजेंटों जैसेजार्विस परियोजना। एलएलएम वाले एजेंट एक रोमांचक विकास है जो जटिल कार्य संचालन के साथ कई उद्योगों पर अविश्वसनीय प्रभाव डालेगा। इन एजेंटों को डेटा और इंटरैक्शन के कई पहलुओं पर नज़र रखने की आवश्यकता होगी, और कैसंड्रा नौकरी के लिए सही डेटाबेस है। विश्वसनीय और प्रदर्शनकारी।
एक आगामी बूट शिविर, "नोकोड, डेटा और एआई: कैसेंड्रा के साथ एलएलएम बूटकैंप ," डेवलपर्स को चैट बॉट बनाने के लिए लाइब्रेरी के साथ हाथ से काम करने का मौका देगा। अपने नजदीकी शहर में आने वाली इस तरह की और गतिविधियों की तलाश करें! हम उपयोगकर्ताओं को खोज करने के लिए प्रोत्साहित करते हैंकेसियो कोफ़ाइल मुद्दे , में हिस्सा लेनामंचों और इस तेजी से भौतिक होने वाले मतिभ्रम को सुधारने में हमारी मदद करें।
कौन जानता है कि इतिहास इस पल का न्याय कैसे करेगा? क्या यह OpenAI की आंतरिक जानकारी का रिसाव था? या, थोड़ा और गहराई से सोचते हुए, क्या यह एआई का पहला कदम है जिससे मनुष्य अपनी बोली लगा सकते हैं? किसी भी तरह से, डेवलपर्स के पास अब कैसेंड्रा के निकट-अनंत पैमाने पर टैप करने के लिए एक सरल-से-उपयोग वाली लाइब्रेरी है, जब जनरेटिव एआई की दुनिया में हड़ताली हो रही है।
चैटजीपीटी ने हमें एक तोहफा दिया है, तो आप इससे क्या बनाने जा रहे हैं? मैं आगामी वेबिनार में सदिश खोज में गोता लगाने जा रहा हूं (registerयहाँ !), और अगर आप बस अंदर आना चाहते हैं और आज ही काम करना शुरू करना चाहते हैं,डेटास्टैक्स एस्ट्रा कुछ बेहतरीन ट्यूटोरियल हैं।
पैट्रिक मैकफैडिन, डेटास्टैक्स द्वारा
पैट्रिक मैकफैडिन ओ'रेली की किताब 'मैनेजिंग क्लाउड नेटिव डेटा ऑन कुबेरनेट्स' के सह-लेखक हैं। वह वर्तमान में डेवलपर संबंधों में डेटास्टैक्स में और अपाचे कैसेंड्रा परियोजना में योगदानकर्ता के रूप में काम करता है। पैट्रिक ने अपाचे कैसेंड्रा के लिए मुख्य इंजीलवादी के रूप में काम किया है (वह एक नवनिर्मित कैसेंड्रा कमिटर भी है!) और डेटास्टैक्स के सलाहकार के रूप में, जहां उनके पास उत्पादन में कुछ सबसे बड़ी तैनाती का निर्माण करने का एक अच्छा समय था।