paint-brush
अपाचे कैसेंड्रा एफएक्यू का जवाब देना द्वारा@datastax
1,097 रीडिंग
1,097 रीडिंग

अपाचे कैसेंड्रा एफएक्यू का जवाब देना

द्वारा DataStax
DataStax HackerNoon profile picture

DataStax

@datastax

DataStax is the real-time data company for building production GenAI...

5 मिनट read2023/02/25
Read on Terminal Reader
Read this story in a terminal
Print this story

बहुत लंबा; पढ़ने के लिए

चूंकि इसे 2007 में विकसित किया गया था, Apache Cassandra ने दुनिया के कुछ सबसे बड़े उद्यमों द्वारा उपयोग किए जाने वाले रॉक-सॉलिड, अत्यधिक स्केलेबल, विश्वसनीय NoSQL डेटा स्टोर के रूप में प्रतिष्ठा बनाई है। लेकिन कैसेंड्रा के साथ काम करने के लिए एक निश्चित स्तर का अनुभव और विशेषज्ञता भी चाहिए। तो यह समझ में आता है कि इस ओपन सोर्स डेटाबेस के बारे में सीखते समय बहुत सारे सवाल उठते हैं। इस लेख में कुछ शीर्ष प्रश्न शामिल हैं जो डेवलपर्स विभिन्न सामुदायिक मंचों पर पूछते हैं।
featured image - अपाचे कैसेंड्रा एफएक्यू का जवाब देना
DataStax HackerNoon profile picture
DataStax

DataStax

@datastax

DataStax is the real-time data company for building production GenAI applications.

चूंकि इसे 2007 में विकसित किया गया था, Apache Cassandra ने दुनिया के कुछ सबसे बड़े उद्यमों द्वारा उपयोग किए जाने वाले रॉक-सॉलिड, अत्यधिक स्केलेबल, विश्वसनीय NoSQL डेटा स्टोर के रूप में प्रतिष्ठा बनाई है। लेकिन कैसेंड्रा के साथ काम करने के लिए एक निश्चित स्तर का अनुभव और विशेषज्ञता भी चाहिए। तो यह समझ में आता है कि इस ओपन सोर्स डेटाबेस के बारे में सीखते समय बहुत सारे सवाल उठते हैं।


इस लेख में कुछ शीर्ष प्रश्न शामिल हैं जो डेवलपर विभिन्न सामुदायिक मंचों पर पूछते हैं।

कैसेंड्रा में विभाजन, क्लस्टरिंग और समग्र कुंजी के बीच क्या अंतर है?

वाइड-कॉलम डेटाबेस में प्राथमिक कुंजी रिलेशनल प्राथमिक कुंजी से कैसे अलग है, यह समझना कैसेंड्रा की शक्ति को सीखने में एक महत्वपूर्ण कदम है।


कैसंड्रा जैसे वाइड-कॉलम स्टोर कॉलम परिवारों की धारणा का उपयोग करते हैं, एक डेटाबेस ऑब्जेक्ट जिसमें संबंधित डेटा के कई कॉलम होते हैं जो एक साथ उपयोग किए जाते हैं, पारंपरिक रिलेशनल डेटाबेस टेबल के समान। किसी दिए गए कॉलम परिवार के भीतर, सभी डेटा को पंक्ति-दर-पंक्ति फैशन में संग्रहीत किया जाता है, जैसे कि किसी दिए गए पंक्ति के कॉलम अलग-अलग संग्रहीत किए जाने के बजाय एक साथ संग्रहीत होते हैं।


दूसरा तरीका रखो, एक स्तंभ परिवार एक कुंजी-मूल्य जोड़ी है, जहां कुंजी को उस मान पर मैप किया जाता है जो स्तंभों का एक सेट है। संबंधपरक डेटाबेस के साथ सादृश्य बनाने के लिए, एक स्तंभ परिवार एक "तालिका" की तरह है, जिसमें प्रत्येक कुंजी-मूल्य जोड़ी एक "पंक्ति" है। डेवलपर्स के लिए, वाइड-कॉलम टेबल खुद को एक पंक्ति-और-कॉलम तालिका के रूप में प्रस्तुत कर सकते हैं जो कोड में या एपीआई के माध्यम से परिचित और काम करने में आसान है।

आइए अवधारणाओं को जीवन में लाने में मदद के लिए कुछ उदाहरण कोड देखें।

image

उपरोक्त कोड में, हमारे पास एक कीस्पेस है, कुछ फ़ील्ड जैसे "शहर," "अंतिम नाम" और "प्रथम नाम"। प्राथमिक कुंजी तल पर है। कैसेंड्रा में सभी तालिकाओं में, कम से कम एक विभाजन कुंजी शामिल होनी चाहिए। ऊपर की छवि द्वारा हाइलाइट किए गए उदाहरण में, हम "शहर" द्वारा विभाजन करेंगे।


इसके बाद जो कुछ भी आता है वह क्लस्टर कॉलम है। "शहर" के आसपास कोष्ठकों पर ध्यान दें - यह इंगित करता है कि यह विभाजन कुंजी है। विभाजन कुंजी क्या है, यह इंगित करने के लिए हम कोष्ठक का उपयोग करते हैं, यदि आपकी विभाजन कुंजी समग्र है और इसमें एक से अधिक कॉलम हैं। फिर यह स्पष्ट है कि कौन से कॉलम प्राथमिक कुंजी के लिए हैं और कौन से कॉलम क्लस्टरिंग हैं।

image

प्राथमिक कुंजी का मुख्य उद्देश्य यह सुनिश्चित करना है कि पंक्ति अद्वितीय है। इसमें शून्य या अधिक क्लस्टरिंग कॉलम भी हो सकते हैं, जो सॉर्टिंग को नियंत्रित कर सकते हैं। लेकिन प्राथमिक कुंजी "समग्र" या "यौगिक" भी हो सकती है, जिसका अर्थ है कि इसमें दो या अधिक कॉलम हैं।

image

विभाजन कुंजी का उपयोग हमारी पंक्तियों को विभाजित करने के लिए किया जाता है और इसमें एक या अधिक कॉलम होते हैं।

Cassandra कैसे मैं चाहता हूँ डेटा युक्त नोड ढूँढता है?

कुछ लोगों को लगता है कि ड्राइवर क्लाइंट सिर्फ एक यादृच्छिक नोड को डेटा भेजते हैं। लेकिन वास्तव में एक गैर-यादृच्छिक तरीका है जिससे आपका ड्राइवर बात करने के लिए एक नोड चुनता है। इस नोड को समन्वयक नोड कहा जाता है। यह आम तौर पर चुना जाता है क्योंकि यह निकटतम है।


क्लाइंट अनुरोध किसी भी नोड को भेजे जा सकते हैं — और सबसे पहले वे उन नोड्स को भेजे जाते हैं जिनके बारे में आपका ड्राइवर जानता है। लेकिन एक बार ड्राइवर सॉफ़्टवेयर आपके क्लस्टर की टोपोलॉजी को जोड़ता है और समझता है, तो यह एक करीबी समन्वयक में बदल सकता है। स्केलेबिलिटी के लिए कंप्यूट और स्टोरेज को कैसे अलग किया जा सकता है, यह जानने के लिए ओपन सोर्स इकोसिस्टम प्रोजेक्ट स्टारगेट देखें।


गपशप प्रोटोकॉल का उपयोग करके एक दूसरे के साथ एक खुले स्रोत कैसेंड्रा क्लस्टर एक्सचेंज टोपोलॉजी जानकारी में नोड्स। गॉसिपर हर सेकंड चलता है और यह सुनिश्चित करता है कि आपके द्वारा कॉन्फ़िगर किए गए किसी भी स्निच से डेटा के साथ सभी नोड्स को चालू रखा जाए। स्निच इस बात पर नज़र रखता है कि प्रत्येक नोड किस डेटा केंद्र और रैक से संबंधित है। इस तरह, समन्वयक नोड के पास डेटा भी होता है जिसके बारे में प्रत्येक टोकन रेंज के लिए कौन से नोड जिम्मेदार होते हैं।


आप कमांड लाइन से एक नोड टूल "रिंग" चलाकर इस जानकारी को देख सकते हैं, हालाँकि यदि आप वर्चुअल नोड्स या "vnodes" का उपयोग कर रहे हैं, तो यह सभी 256 वर्चुअल नोड्स (डिफ़ॉल्ट रूप से) पर डेटा के रूप में पता लगाने के लिए थोड़ा मुश्किल होगा अमाउंट) स्क्रीन के पास बहुत जल्दी फ्लैश होगा।


K8ssandra.io पर, यह व्यवहार अधिक Kubernetes-native है, और क्लस्टर मेटाडेटा, साथ ही सुरक्षित स्कीमा अपडेट को प्रचारित करने के लिए गॉसिप प्रोटोकॉल के बजाय Etcd का उपयोग किया जाता है।

कैसंड्रा में सेकेंडरी इंडेक्स कैसे काम करते हैं?

अनुक्रमण बहुत सूक्ष्म है। यह डेटाबेस इंटर्नल्स को समझने में मदद करता है। कैसेंड्रा में यह क्वेरी आंतरिक रूप से कैसे काम करेगी? इस उदाहरण कोड पर एक नज़र डालें:

image

कैसेंड्रा में यह क्वेरी आंतरिक रूप से कैसे काम करेगी?


अनिवार्य रूप से विभाजन के लिए 35 के बराबर स्कोप आईडी और 78005 के बराबर फॉर्म आईडी के साथ सभी डेटा लौटाए जाएंगे, और फिर इसे रिकॉर्ड लिंक आईडी इंडेक्स द्वारा फ़िल्टर किया जाएगा। यह 9897 के लिए रिकॉर्ड इंडेक्स आईडी प्रविष्टि को देखेगा या उन प्रविष्टियों से मिलान करने का प्रयास करेगा जो पंक्तियों से मेल खाते हैं जहां स्कोप आईडी 35 के बराबर है और फॉर्म आईडी 78005 के बराबर है। विभाजन कुंजियों और अनुक्रमणिका कुंजियों के लिए पंक्तियों का प्रतिच्छेदन लौटाया जाएगा .


आप उचित रूप से पूछ सकते हैं कि रिकॉर्ड लिंक आईडी इंडेक्स जैसे उच्च-कार्डिनैलिटी कॉलम उसके लिए क्वेरी प्रदर्शन को प्रभावित करेगा या नहीं। मुख्य तालिका में लगभग प्रत्येक प्रविष्टि के लिए उच्च-कार्डिनैलिटी इंडेक्स अनिवार्य रूप से एक पंक्ति बनाते हैं। प्रदर्शन प्रभावित हो सकता है क्योंकि कैसंड्रा को क्वेरी परिणामों के लिए अनुक्रमिक पढ़ने के लिए डिज़ाइन किया गया है। एक इंडेक्स क्वेरी अनिवार्य रूप से कैसंड्रा को रैंडम रीड्स करने के लिए मजबूर करती है क्योंकि आपके इंडेक्स की कार्डिनैलिटी बढ़ जाती है, इसलिए क्वेरी वैल्यू को खोजने में लगने वाला समय भी बढ़ जाता है।


तो, क्या कैसंड्रा उपरोक्त क्वेरी के लिए सभी नोड्स को स्पर्श करेगा? नहीं, इसे केवल उस नोड को स्पर्श करना चाहिए जो उस स्कोप आईडी के लिए ज़िम्मेदार है जो 35 के बराबर है और वह फॉर्म आईडी 78005 विभाजन के बराबर है। इंडेक्स, इसी तरह, स्थानीय रूप से संग्रहीत होते हैं और केवल स्थानीय नोड के लिए मान्य प्रविष्टियां होती हैं।

कैसंड्रा और डेटास्टैक्स एस्ट्रा डीबी के बीच क्या अंतर है?

Cassandra एक खुला स्रोत NoSQL डेटाबेस है जो उन वितरित अनुप्रयोगों को शक्ति प्रदान करता है जिनका आप शायद हर दिन बड़े पैमाने पर उपयोग कर रहे हैं। हालाँकि, यह आपके और आपकी टीम पर निर्भर है कि आप स्व-प्रबंधन करें।


दूसरी ओर, एस्ट्रा डीबी एक सर्वर रहित डेटाबेस-ए-ए-सर्विस है। यह कैसेंड्रा पर निर्मित पूरी तरह से प्रबंधित, ऑटोस्केलिंग क्लाउड सेवा है और आपकी पसंद के सार्वजनिक क्लाउड प्रदाता पर चलती है।

ओपन सोर्स डेटा एपीआई गेटवे स्टारगेट के अतिरिक्त, कैसंड्रा और एस्ट्रा डीबी दोनों दस्तावेज़, स्तंभ, और की-वैल्यू नोएसक्यूएल वर्कलोड की सेवा करते हैं। और एस्ट्रा डीबी के साथ, स्टारगेट स्वचालित रूप से आपके लिए स्थापित हो जाता है।


कैसेंड्रा के बारे में अधिक जानना चाहते हैं? कैसेंड्रा फॉरवर्ड में हमसे जुड़ें, 14 मार्च को एक मुफ्त डिजिटल कार्यक्रम!


यहाँ भी प्रकाशित हुआ।


L O A D I N G
. . . comments & more!

About Author

DataStax HackerNoon profile picture
DataStax@datastax
DataStax is the real-time data company for building production GenAI applications.

लेबल

इस लेख में चित्रित किया गया था...

Read on Terminal Reader
Read this story in a terminal
 Terminal
Read this story w/o Javascript
Read this story w/o Javascript
 Lite
X REMOVE AD