DataStax is the real-time data company for building production GenAI applications.
चूंकि इसे 2007 में विकसित किया गया था, Apache Cassandra ने दुनिया के कुछ सबसे बड़े उद्यमों द्वारा उपयोग किए जाने वाले रॉक-सॉलिड, अत्यधिक स्केलेबल, विश्वसनीय NoSQL डेटा स्टोर के रूप में प्रतिष्ठा बनाई है। लेकिन कैसेंड्रा के साथ काम करने के लिए एक निश्चित स्तर का अनुभव और विशेषज्ञता भी चाहिए। तो यह समझ में आता है कि इस ओपन सोर्स डेटाबेस के बारे में सीखते समय बहुत सारे सवाल उठते हैं।
इस लेख में कुछ शीर्ष प्रश्न शामिल हैं जो डेवलपर विभिन्न सामुदायिक मंचों पर पूछते हैं।
वाइड-कॉलम डेटाबेस में प्राथमिक कुंजी रिलेशनल प्राथमिक कुंजी से कैसे अलग है, यह समझना कैसेंड्रा की शक्ति को सीखने में एक महत्वपूर्ण कदम है।
कैसंड्रा जैसे वाइड-कॉलम स्टोर कॉलम परिवारों की धारणा का उपयोग करते हैं, एक डेटाबेस ऑब्जेक्ट जिसमें संबंधित डेटा के कई कॉलम होते हैं जो एक साथ उपयोग किए जाते हैं, पारंपरिक रिलेशनल डेटाबेस टेबल के समान। किसी दिए गए कॉलम परिवार के भीतर, सभी डेटा को पंक्ति-दर-पंक्ति फैशन में संग्रहीत किया जाता है, जैसे कि किसी दिए गए पंक्ति के कॉलम अलग-अलग संग्रहीत किए जाने के बजाय एक साथ संग्रहीत होते हैं।
दूसरा तरीका रखो, एक स्तंभ परिवार एक कुंजी-मूल्य जोड़ी है, जहां कुंजी को उस मान पर मैप किया जाता है जो स्तंभों का एक सेट है। संबंधपरक डेटाबेस के साथ सादृश्य बनाने के लिए, एक स्तंभ परिवार एक "तालिका" की तरह है, जिसमें प्रत्येक कुंजी-मूल्य जोड़ी एक "पंक्ति" है। डेवलपर्स के लिए, वाइड-कॉलम टेबल खुद को एक पंक्ति-और-कॉलम तालिका के रूप में प्रस्तुत कर सकते हैं जो कोड में या एपीआई के माध्यम से परिचित और काम करने में आसान है।
आइए अवधारणाओं को जीवन में लाने में मदद के लिए कुछ उदाहरण कोड देखें।
उपरोक्त कोड में, हमारे पास एक कीस्पेस है, कुछ फ़ील्ड जैसे "शहर," "अंतिम नाम" और "प्रथम नाम"। प्राथमिक कुंजी तल पर है। कैसेंड्रा में सभी तालिकाओं में, कम से कम एक विभाजन कुंजी शामिल होनी चाहिए। ऊपर की छवि द्वारा हाइलाइट किए गए उदाहरण में, हम "शहर" द्वारा विभाजन करेंगे।
इसके बाद जो कुछ भी आता है वह क्लस्टर कॉलम है। "शहर" के आसपास कोष्ठकों पर ध्यान दें - यह इंगित करता है कि यह विभाजन कुंजी है। विभाजन कुंजी क्या है, यह इंगित करने के लिए हम कोष्ठक का उपयोग करते हैं, यदि आपकी विभाजन कुंजी समग्र है और इसमें एक से अधिक कॉलम हैं। फिर यह स्पष्ट है कि कौन से कॉलम प्राथमिक कुंजी के लिए हैं और कौन से कॉलम क्लस्टरिंग हैं।
प्राथमिक कुंजी का मुख्य उद्देश्य यह सुनिश्चित करना है कि पंक्ति अद्वितीय है। इसमें शून्य या अधिक क्लस्टरिंग कॉलम भी हो सकते हैं, जो सॉर्टिंग को नियंत्रित कर सकते हैं। लेकिन प्राथमिक कुंजी "समग्र" या "यौगिक" भी हो सकती है, जिसका अर्थ है कि इसमें दो या अधिक कॉलम हैं।
विभाजन कुंजी का उपयोग हमारी पंक्तियों को विभाजित करने के लिए किया जाता है और इसमें एक या अधिक कॉलम होते हैं।
कुछ लोगों को लगता है कि ड्राइवर क्लाइंट सिर्फ एक यादृच्छिक नोड को डेटा भेजते हैं। लेकिन वास्तव में एक गैर-यादृच्छिक तरीका है जिससे आपका ड्राइवर बात करने के लिए एक नोड चुनता है। इस नोड को समन्वयक नोड कहा जाता है। यह आम तौर पर चुना जाता है क्योंकि यह निकटतम है।
क्लाइंट अनुरोध किसी भी नोड को भेजे जा सकते हैं — और सबसे पहले वे उन नोड्स को भेजे जाते हैं जिनके बारे में आपका ड्राइवर जानता है। लेकिन एक बार ड्राइवर सॉफ़्टवेयर आपके क्लस्टर की टोपोलॉजी को जोड़ता है और समझता है, तो यह एक करीबी समन्वयक में बदल सकता है। स्केलेबिलिटी के लिए कंप्यूट और स्टोरेज को कैसे अलग किया जा सकता है, यह जानने के लिए ओपन सोर्स इकोसिस्टम प्रोजेक्ट स्टारगेट देखें।
गपशप प्रोटोकॉल का उपयोग करके एक दूसरे के साथ एक खुले स्रोत कैसेंड्रा क्लस्टर एक्सचेंज टोपोलॉजी जानकारी में नोड्स। गॉसिपर हर सेकंड चलता है और यह सुनिश्चित करता है कि आपके द्वारा कॉन्फ़िगर किए गए किसी भी स्निच से डेटा के साथ सभी नोड्स को चालू रखा जाए। स्निच इस बात पर नज़र रखता है कि प्रत्येक नोड किस डेटा केंद्र और रैक से संबंधित है। इस तरह, समन्वयक नोड के पास डेटा भी होता है जिसके बारे में प्रत्येक टोकन रेंज के लिए कौन से नोड जिम्मेदार होते हैं।
आप कमांड लाइन से एक नोड टूल "रिंग" चलाकर इस जानकारी को देख सकते हैं, हालाँकि यदि आप वर्चुअल नोड्स या "vnodes" का उपयोग कर रहे हैं, तो यह सभी 256 वर्चुअल नोड्स (डिफ़ॉल्ट रूप से) पर डेटा के रूप में पता लगाने के लिए थोड़ा मुश्किल होगा अमाउंट) स्क्रीन के पास बहुत जल्दी फ्लैश होगा।
K8ssandra.io पर, यह व्यवहार अधिक Kubernetes-native है, और क्लस्टर मेटाडेटा, साथ ही सुरक्षित स्कीमा अपडेट को प्रचारित करने के लिए गॉसिप प्रोटोकॉल के बजाय Etcd का उपयोग किया जाता है।
अनुक्रमण बहुत सूक्ष्म है। यह डेटाबेस इंटर्नल्स को समझने में मदद करता है। कैसेंड्रा में यह क्वेरी आंतरिक रूप से कैसे काम करेगी? इस उदाहरण कोड पर एक नज़र डालें:
कैसेंड्रा में यह क्वेरी आंतरिक रूप से कैसे काम करेगी?
अनिवार्य रूप से विभाजन के लिए 35 के बराबर स्कोप आईडी और 78005 के बराबर फॉर्म आईडी के साथ सभी डेटा लौटाए जाएंगे, और फिर इसे रिकॉर्ड लिंक आईडी इंडेक्स द्वारा फ़िल्टर किया जाएगा। यह 9897 के लिए रिकॉर्ड इंडेक्स आईडी प्रविष्टि को देखेगा या उन प्रविष्टियों से मिलान करने का प्रयास करेगा जो पंक्तियों से मेल खाते हैं जहां स्कोप आईडी 35 के बराबर है और फॉर्म आईडी 78005 के बराबर है। विभाजन कुंजियों और अनुक्रमणिका कुंजियों के लिए पंक्तियों का प्रतिच्छेदन लौटाया जाएगा .
आप उचित रूप से पूछ सकते हैं कि रिकॉर्ड लिंक आईडी इंडेक्स जैसे उच्च-कार्डिनैलिटी कॉलम उसके लिए क्वेरी प्रदर्शन को प्रभावित करेगा या नहीं। मुख्य तालिका में लगभग प्रत्येक प्रविष्टि के लिए उच्च-कार्डिनैलिटी इंडेक्स अनिवार्य रूप से एक पंक्ति बनाते हैं। प्रदर्शन प्रभावित हो सकता है क्योंकि कैसंड्रा को क्वेरी परिणामों के लिए अनुक्रमिक पढ़ने के लिए डिज़ाइन किया गया है। एक इंडेक्स क्वेरी अनिवार्य रूप से कैसंड्रा को रैंडम रीड्स करने के लिए मजबूर करती है क्योंकि आपके इंडेक्स की कार्डिनैलिटी बढ़ जाती है, इसलिए क्वेरी वैल्यू को खोजने में लगने वाला समय भी बढ़ जाता है।
तो, क्या कैसंड्रा उपरोक्त क्वेरी के लिए सभी नोड्स को स्पर्श करेगा? नहीं, इसे केवल उस नोड को स्पर्श करना चाहिए जो उस स्कोप आईडी के लिए ज़िम्मेदार है जो 35 के बराबर है और वह फॉर्म आईडी 78005 विभाजन के बराबर है। इंडेक्स, इसी तरह, स्थानीय रूप से संग्रहीत होते हैं और केवल स्थानीय नोड के लिए मान्य प्रविष्टियां होती हैं।
Cassandra एक खुला स्रोत NoSQL डेटाबेस है जो उन वितरित अनुप्रयोगों को शक्ति प्रदान करता है जिनका आप शायद हर दिन बड़े पैमाने पर उपयोग कर रहे हैं। हालाँकि, यह आपके और आपकी टीम पर निर्भर है कि आप स्व-प्रबंधन करें।
दूसरी ओर, एस्ट्रा डीबी एक सर्वर रहित डेटाबेस-ए-ए-सर्विस है। यह कैसेंड्रा पर निर्मित पूरी तरह से प्रबंधित, ऑटोस्केलिंग क्लाउड सेवा है और आपकी पसंद के सार्वजनिक क्लाउड प्रदाता पर चलती है।
ओपन सोर्स डेटा एपीआई गेटवे स्टारगेट के अतिरिक्त, कैसंड्रा और एस्ट्रा डीबी दोनों दस्तावेज़, स्तंभ, और की-वैल्यू नोएसक्यूएल वर्कलोड की सेवा करते हैं। और एस्ट्रा डीबी के साथ, स्टारगेट स्वचालित रूप से आपके लिए स्थापित हो जाता है।
कैसेंड्रा के बारे में अधिक जानना चाहते हैं? कैसेंड्रा फॉरवर्ड में हमसे जुड़ें, 14 मार्च को एक मुफ्त डिजिटल कार्यक्रम!
यहाँ भी प्रकाशित हुआ।
अपाचे कैसेंड्रा एफएक्यू का जवाब देना | HackerNoon