paint-brush
PostgreSQL डेटा के भविष्य का आधार क्यों है?द्वारा@timescale
1,229 रीडिंग
1,229 रीडिंग

PostgreSQL डेटा के भविष्य का आधार क्यों है?

द्वारा Timescale14m2024/04/26
Read on Terminal Reader

बहुत लंबा; पढ़ने के लिए

PostgreSQL का गो-टू डेटाबेस मानक के रूप में वर्चस्व इसकी अनुकूलनशीलता, विश्वसनीयता और व्यापक पारिस्थितिकी तंत्र में निहित है। यह लेख डेटाबेस जटिलता से निपटने से लेकर डेवलपर्स को आत्मविश्वास के साथ भविष्य का निर्माण करने के लिए सशक्त बनाने तक, इसके प्रभुत्व के पीछे के कारणों पर गहराई से चर्चा करता है। जानें कि PostgreSQL किस तरह से सॉफ़्टवेयर विकास और डेटा प्रबंधन प्रथाओं में क्रांति ला रहा है।
featured image - PostgreSQL डेटा के भविष्य का आधार क्यों है?
Timescale HackerNoon profile picture
0-item


आज सॉफ्टवेयर विकास में सबसे बड़े रुझानों में से एक है PostgreSQL का वास्तविक डेटाबेस मानक के रूप में उभरना। PostgreSQL का हर चीज़ के लिए उपयोग कैसे करें, इस पर कुछ ब्लॉग पोस्ट किए गए हैं, लेकिन अभी तक इस पर कोई पोस्ट नहीं किया गया है कि ऐसा क्यों हो रहा है (और सबसे महत्वपूर्ण बात यह है कि यह क्यों मायने रखता है)।


अब तक!


विषयसूची

01 PostgreSQL वास्तविक डेटाबेस मानक बन रहा है

02 सब कुछ कंप्यूटर बन रहा है

03 PostgreSQL की वापसी

04 खुद को मुक्त करें, भविष्य का निर्माण करें, PostgreSQL को अपनाएं

05 टाइमस्केल की शुरुआत “टाइम सीरीज़ के लिए PostgreSQL” के रूप में हुई

06 समय श्रृंखला से परे विस्तारित समय-सीमा

07 टाइमस्केल अब “पोस्टग्रेएसक्यूएल को शक्तिशाली बनाया गया है”

08 कोडा: योदा?




PostgreSQL वास्तविक डेटाबेस मानक बन रहा है

पिछले कई महीनों में, "हर चीज के लिए PostgreSQL" डेवलपर्स के बीच एक बढ़ता हुआ नारा बन गया है:

"पोस्टग्रेएसक्यूएल सिर्फ़ एक सरल रिलेशनल डेटाबेस नहीं है; यह एक डेटा प्रबंधन ढांचा है जिसमें पूरे डेटाबेस क्षेत्र को समाहित करने की क्षमता है। "हर चीज़ के लिए पोस्टग्रेज़ का उपयोग करने" का चलन अब कुछ खास टीमों तक सीमित नहीं रह गया है, बल्कि यह मुख्यधारा का सबसे अच्छा अभ्यास बन रहा है।"

( स्रोत )


"अपने स्टैक को सरल बनाने और मूविंग पार्ट्स को कम करने, विकास को गति देने, जोखिम को कम करने और अपने स्टार्टअप में अधिक सुविधाएँ देने का एक तरीका है "हर चीज़ के लिए Postgres का उपयोग करें।" Postgres लाखों उपयोगकर्ताओं तक कई बैकएंड तकनीकों की जगह ले सकता है, जिनमें Kafka, RabbitMQ, Mongo और Redis शामिल हैं।"

( स्रोत )


गेरगेली ओरोस | अभिषेक



( स्रोत )


"जब मैंने पहली बार पोस्टग्रेस के बारे में सुना (उस समय जब MySQL का पूरी तरह से बोलबाला था), तो मुझे इसका वर्णन "गणित के जानकारों द्वारा बनाया गया डेटाबेस" के रूप में किया गया था, और फिर मेरे मन में यह विचार आया: हाँ, ये वही लोग हैं जिन्हें आप अपना डेटाबेस बनाना चाहते हैं।"

( स्रोत )


"इसने एक उल्लेखनीय वापसी की है। अब जब NoSQL खत्म हो चुका है और Oracle के पास MySQL का स्वामित्व है, तो और क्या बचा है?"

( स्रोत )


"पोस्टग्रेज सिर्फ एक रिलेशनल डेटाबेस नहीं है। यह जीने का एक तरीका है।"

( स्रोत )


इसकी ठोस नींव, तथा मूल सुविधाओं और एक्सटेंशन के माध्यम से इसकी बहुमुखी प्रतिभा के कारण, डेवलपर्स अब PostgreSQL का उपयोग हर चीज के लिए कर सकते हैं, तथा जटिल, भंगुर डेटा आर्किटेक्चर को सरलता के साथ प्रतिस्थापित कर सकते हैं:



इससे यह समझने में मदद मिल सकती है कि पिछले वर्ष PostgreSQL ने व्यावसायिक डेवलपर्स (60,369 उत्तरदाताओं) के बीच सर्वाधिक लोकप्रिय डाटाबेस की रैंकिंग में MySQL से शीर्ष स्थान क्यों प्राप्त किया:


पिछले वर्ष आपने किस डेटाबेस वातावरण में व्यापक विकास कार्य किया है, और अगले वर्ष आप किसमें काम करना चाहते हैं? 49% से अधिक उत्तरदाताओं ने PostgreSQL का उत्तर दिया। ( स्रोत )


ये परिणाम 2023 स्टैक ओवरफ़्लो डेवलपर सर्वेक्षण से हैं। यदि आप समय के साथ देखें, तो आप पिछले कुछ वर्षों में PostgreSQL अपनाने में लगातार वृद्धि देख सकते हैं:


जबकि PostgreSQL 2020-2022 के बीच स्टैक ओवरफ्लो के डेवलपर सर्वेक्षण उत्तरदाताओं का दूसरा पसंदीदा डेटाबेस था, इसका उपयोग लगातार बढ़ रहा है। स्रोत: 2020 , 2021 , 2022


यह सिर्फ़ छोटे स्टार्टअप और शौकिया लोगों के बीच का चलन नहीं है। वास्तव में, PostgreSQL का उपयोग सभी आकार के संगठनों में बढ़ रहा है:


कंपनी के आकार के अनुसार PostgreSQL उपयोग का प्रतिशत. ( स्रोत )


टाइमस्केल में, यह चलन हमारे लिए नया नहीं है। हम लगभग एक दशक से PostgreSQL के समर्थक रहे हैं। यही कारण है कि हमने अपना व्यवसाय PostgreSQL पर बनाया है, यही कारण है कि हम उनमें से एक हैं PostgreSQL के शीर्ष योगदानकर्ता , हम वार्षिक क्यों चलाते हैं PostgreSQL सर्वेक्षण की स्थिति (ऊपर संदर्भित), और हम PostgreSQL मीटअप और सम्मेलनों का समर्थन क्यों करते हैं। व्यक्तिगत रूप से, मैं 13 वर्षों से अधिक समय से PostgreSQL का उपयोग कर रहा हूँ (जब मैंने MySQL से स्विच किया था)।


पोस्टग्रेएसक्यूएल का उपयोग हर चीज के लिए कैसे किया जाए, इस पर कुछ ब्लॉग पोस्ट किए गए हैं, लेकिन ऐसा क्यों हो रहा है (और, इससे भी महत्वपूर्ण बात यह है कि यह क्यों मायने रखता है) इस पर अभी तक कोई पोस्ट नहीं किया गया है।


अब तक।


लेकिन यह समझने के लिए कि ऐसा क्यों हो रहा है, हमें एक और भी अधिक आधारभूत प्रवृत्ति को समझना होगा और यह भी कि वह प्रवृत्ति किस प्रकार मानवीय वास्तविकता की मौलिक प्रकृति को बदल रही है।


सब कुछ कंप्यूटर बनता जा रहा है

हमारी कारें, हमारे घर, हमारे शहर, हमारे खेत, हमारे कारखाने, हमारी मुद्राएँ, हमारी चीज़ें सब कुछ कंप्यूटर बन रहा है। हम भी डिजिटल होते जा रहे हैं। हर साल, हम अपनी पहचान और कार्यों को और अधिक डिजिटल बनाते जा रहे हैं: हम कैसे चीज़ें खरीदते हैं, हम कैसे अपना मनोरंजन करते हैं, हम कैसे कलाकृतियाँ इकट्ठा करते हैं, हम अपने सवालों के जवाब कैसे ढूँढ़ते हैं, हम कैसे संवाद करते हैं और जुड़ते हैं, हम कैसे व्यक्त करते हैं कि हम कौन हैं।


बाईस साल पहले, “सर्वव्यापी कंप्यूटिंग” का यह विचार बहुत ही साहसिक लगता था। उस समय, मैं MIT AI लैब में स्नातक छात्र था, अपने AI पर काम कर रहा था। थीसिस बुद्धिमान वातावरण पर। मेरे शोध को समर्थन मिला एमआईटी प्रोजेक्ट ऑक्सीजन , जिसका एक महान, साहसिक लक्ष्य था: कंप्यूटिंग को उतना ही व्यापक बनाना जितना हम सांस लेते हैं। उस समय को परिप्रेक्ष्य में रखते हुए: हमारे पास एक कोठरी में हमारा सर्वर रैक था।


तब से अब तक बहुत कुछ बदल चुका है। कंप्यूटिंग अब सर्वव्यापी है: हमारी डेस्क पर, हमारी जेबों में, हमारी चीज़ों में और हमारे "क्लाउड" में। इतना तो हमने पहले ही अनुमान लगा लिया था।


लेकिन उन परिवर्तनों के दूसरे क्रम के प्रभाव वैसे नहीं थे जैसी हममें से अधिकांश लोगों ने अपेक्षा की थी:


  • सर्वव्यापी कंप्यूटिंग ने सर्वव्यापी डेटा को जन्म दिया है। प्रत्येक नए कंप्यूटिंग डिवाइस के साथ, हम अपनी वास्तविकता के बारे में अधिक जानकारी एकत्र करते हैं: मानव डेटा, मशीन डेटा, व्यवसाय डेटा, पर्यावरण डेटा और सिंथेटिक डेटा। यह डेटा हमारी दुनिया में बाढ़ ला रहा है।


  • डेटा की बाढ़ ने डेटाबेस के कैम्ब्रियन विस्फोट को जन्म दिया है । डेटा के इन सभी नए स्रोतों को उन्हें संग्रहीत करने के लिए नए स्थानों की आवश्यकता है। बीस साल पहले, शायद पाँच व्यवहार्य डेटाबेस विकल्प थे। आज कई सौ हैं, उनमें से अधिकांश विशिष्ट उपयोग मामलों या डेटा के लिए विशेषीकृत हैं, और हर महीने नए विकल्प सामने आ रहे हैं।


  • अधिक डेटा और अधिक डेटाबेस ने सॉफ़्टवेयर की जटिलता को और बढ़ा दिया है। अपने सॉफ़्टवेयर कार्यभार के लिए सही डेटाबेस चुनना अब आसान नहीं है। इसके बजाय, डेवलपर्स को जटिल आर्किटेक्चर को एक साथ जोड़ने के लिए मजबूर किया जाता है जिसमें शामिल हो सकते हैं: एक रिलेशनल डेटाबेस (इसकी विश्वसनीयता के लिए), एक गैर-रिलेशनल डेटाबेस (इसकी स्केलेबिलिटी के लिए), एक डेटा वेयरहाउस (विश्लेषण करने की इसकी क्षमता के लिए), एक ऑब्जेक्ट स्टोर (पुराने डेटा को सस्ते में संग्रहीत करने की इसकी क्षमता के लिए)। इस आर्किटेक्चर में टाइम-सीरीज़ या वेक्टर डेटाबेस जैसे अधिक विशिष्ट घटक भी हो सकते हैं।


  • अधिक जटिलता का मतलब है निर्माण में कम समय। जटिल आर्किटेक्चर अधिक भंगुर होते हैं, अधिक जटिल एप्लिकेशन लॉजिक की आवश्यकता होती है, विकास के लिए कम समय देते हैं, और विकास को धीमा कर देते हैं। जटिलता कोई लाभ नहीं बल्कि वास्तविक लागत है।


जैसे-जैसे कंप्यूटिंग सर्वव्यापी होती गई है, हमारी वास्तविकता कंप्यूटिंग के साथ और अधिक जुड़ती गई है। हमने कंप्यूटिंग को अपनी दुनिया में और खुद को इसकी दुनिया में शामिल कर लिया है। अब हम सिर्फ़ अपनी ऑफ़लाइन पहचान नहीं रह गए हैं, बल्कि हम ऑफ़लाइन और ऑनलाइन जो करते हैं उसका मिश्रण बन गए हैं।


सॉफ्टवेयर डेवलपर्स इस नई वास्तविकता में मानवता के अगुआ हैं। हम ही ऐसे सॉफ्टवेयर का निर्माण कर रहे हैं जो इस नई वास्तविकता को आकार दे रहा है।


लेकिन अब डेवलपर्स डेटा से अभिभूत हो गए हैं और डेटाबेस की जटिलता में डूब रहे हैं।


इसका मतलब यह है कि डेवलपर्स भविष्य को आकार देने के बजाय अपना अधिक से अधिक समय पाइपलाइन के प्रबंधन में खर्च कर रहे हैं।


हम यहाँ कैसे आए?

भाग 1: कैस्केडिंग कंप्यूटिंग तरंगें

सर्वव्यापी कंप्यूटिंग ने सर्वव्यापी डेटा को जन्म दिया है। यह रातों-रात नहीं हुआ, बल्कि कई दशकों में क्रमिक रूप से हुआ:


  • मेनफ्रेम (1950 के दशक से अधिक)
  • पर्सनल कंप्यूटर (1970 के दशक से अधिक)
  • इंटरनेट (1990 के दशक से अधिक)
  • मोबाइल (2000+)
  • क्लाउड कंप्यूटिंग (2000 के दशक से अधिक)
  • इंटरनेट ऑफ थिंग्स (2010+)


प्रत्येक लहर के साथ, कंप्यूटर छोटे, अधिक शक्तिशाली और अधिक सर्वव्यापी होते गए हैं। प्रत्येक लहर ने पिछली लहर पर भी निर्माण किया: पर्सनल कंप्यूटर छोटे मेनफ्रेम हैं; इंटरनेट जुड़े हुए कंप्यूटरों का एक नेटवर्क है; स्मार्टफोन इंटरनेट से जुड़े और भी छोटे कंप्यूटर हैं; क्लाउड कंप्यूटिंग ने कंप्यूटिंग संसाधनों तक पहुँच को लोकतांत्रिक बनाया; इंटरनेट ऑफ़ थिंग्स स्मार्टफोन के घटक हैं जिन्हें क्लाउड से जुड़ी अन्य भौतिक चीज़ों के हिस्से के रूप में पुनर्निर्मित किया गया है।


लेकिन पिछले दो दशकों में, कंप्यूटिंग प्रगति सिर्फ भौतिक दुनिया में ही नहीं हुई है, बल्कि डिजिटल दुनिया में भी हुई है, जो हमारी संकर वास्तविकता को प्रतिबिंबित करती है:


  • सामाजिक नेटवर्क (2000+)
  • ब्लॉकचेन (2010+)
  • जनरेटिव एआई (2020+)


कंप्यूटिंग की प्रत्येक नई लहर के साथ, हमें अपनी हाइब्रिड वास्तविकता के बारे में जानकारी के नए स्रोत मिलते हैं: मानव डिजिटल निकास, मशीन डेटा, व्यावसायिक डेटा और सिंथेटिक डेटा। भविष्य की लहरें और भी अधिक डेटा बनाएंगी। यह सारा डेटा नई तरंगों को बढ़ावा देता है, जिनमें से नवीनतम है जनरेटिव एआई, जो बदले में हमारी वास्तविकता को और आकार देता है।


कंप्यूटिंग तरंगें एक जगह पर नहीं बल्कि डोमिनोज़ की तरह झरती हैं। जो डेटा की एक बूंद के रूप में शुरू हुआ वह जल्द ही डेटा की बाढ़ बन गया। और फिर डेटा की बाढ़ ने अधिक से अधिक डेटाबेस के निर्माण को जन्म दिया।

भाग 2: वृद्धिशील डेटाबेस वृद्धि

डेटा के इन सभी नए स्रोतों को संग्रहीत करने के लिए नए स्थानों या डेटाबेस की आवश्यकता पड़ी है।


मेनफ्रेम की शुरुआत हुई एकीकृत डेटा स्टोर (1964) और बाद में सिस्टम आर (1974), पहला SQL डेटाबेस। पर्सनल कंप्यूटर ने पहले वाणिज्यिक डेटाबेस के उदय को बढ़ावा दिया: आकाशवाणी (1977), सिस्टम आर से प्रेरित; डीबी 2 (1983); और एस क्यू एल सर्वर (1989), माइक्रोसॉफ्ट की ओरेकल के प्रति प्रतिक्रिया।


इंटरनेट की सहयोगात्मक शक्ति ने ओपन-सोर्स सॉफ्टवेयर के उदय को सक्षम बनाया, जिसमें पहला ओपन-सोर्स डाटाबेस भी शामिल है: माई एसक्यूएल (1995), पोस्टग्रेएसक्यूएल (1996)। स्मार्टफोन के कारण मोबाइल फोन का चलन बढ़ा SQLite (प्रारंभ में 2000 में बनाया गया)।


इंटरनेट ने भारी मात्रा में डेटा भी निर्मित किया, जिसके परिणामस्वरूप पहला गैर-संबंधपरक या NoSQL डेटाबेस अस्तित्व में आया: हाडोप (2006); कैसेंड्रा (2008); मोंगोडीबी (2009)। कुछ लोगों ने इसे “बिग डेटा” का युग कहा।

भाग 3: विस्फोटक डेटाबेस वृद्धि

2010 के आसपास, हम एक टूटने वाले बिंदु पर पहुँचने लगे। उस बिंदु तक, सॉफ़्टवेयर अनुप्रयोग मुख्य रूप से एकल डेटाबेस पर निर्भर थे - जैसे, Oracle, MySQL, PostgreSQL - और चुनाव अपेक्षाकृत आसान था।


लेकिन "बिग डेटा" लगातार बड़ा होता गया: इंटरनेट ऑफ थिंग्स ने मशीन डेटा के उदय को जन्म दिया; iPhone और Android की बदौलत स्मार्टफोन का उपयोग तेजी से बढ़ने लगा, जिससे मानव डिजिटल निकास और भी अधिक हो गया; क्लाउड कंप्यूटिंग ने कंप्यूट और स्टोरेज तक पहुँच को लोकतांत्रिक बना दिया, जिससे इन प्रवृत्तियों में वृद्धि हुई। हाल ही में जेनरेटिव AI ने वेक्टर डेटा के निर्माण के साथ इस समस्या को और भी बदतर बना दिया है।


जैसे-जैसे एकत्रित आंकड़ों की मात्रा बढ़ी, हमने विशिष्ट डेटाबेसों का उदय देखा: नियो4जे ग्राफ डेटा के लिए (2007), रेडिस बुनियादी कुंजी-मूल्य संग्रह के लिए (2009), इन्फ्लक्सडीबी समय-श्रृंखला डेटा के लिए (2013), क्लिकहाउस उच्च-स्तरीय विश्लेषण के लिए (2016), वेक्टर डेटा के लिए पाइनकोन (2019), और कई, कई अन्य।


बीस साल पहले, शायद पाँच व्यवहार्य डेटाबेस विकल्प थे। आज, सैंकडो इनमें से ज़्यादातर डेटाबेस खास इस्तेमाल के मामलों के लिए खास हैं, हर महीने नए डेटाबेस सामने आते रहते हैं। जबकि पहले के डेटाबेस सामान्य बहुमुखी प्रतिभा का वादा करते हैं, ये विशेष डेटाबेस खास ट्रेड-ऑफ़ प्रदान करते हैं, जो आपके इस्तेमाल के मामले के आधार पर समझ में आ भी सकते हैं और नहीं भी।

भाग 4: अधिक डेटाबेस, अधिक समस्याएं

इस बाढ़ और विभिन्न प्रकार के समझौतों वाले विशेषीकृत डाटाबेसों का सामना करते हुए, डेवलपर्स के पास जटिल आर्किटेक्चर तैयार करने के अलावा कोई विकल्प नहीं था।


इन आर्किटेक्चर में आम तौर पर एक रिलेशनल डेटाबेस (विश्वसनीयता के लिए), एक नॉन-रिलेशनल डेटाबेस (स्केलेबिलिटी के लिए), एक डेटा वेयरहाउस (डेटा विश्लेषण के लिए), एक ऑब्जेक्ट स्टोर (सस्ते संग्रहण के लिए), और यहां तक कि उन उपयोग मामलों के लिए टाइम-सीरीज़ या वेक्टर डेटाबेस जैसे अधिक विशिष्ट घटक भी शामिल होते हैं।



लेकिन ज़्यादा जटिलता का मतलब है निर्माण में कम समय। जटिल आर्किटेक्चर ज़्यादा भंगुर होते हैं, ज़्यादा जटिल एप्लिकेशन लॉजिक की ज़रूरत होती है, विकास के लिए कम समय देते हैं और विकास को धीमा कर देते हैं।


इसका मतलब यह है कि भविष्य का निर्माण करने के बजाय, सॉफ्टवेयर डेवलपर्स अपना ज़्यादातर समय प्लंबिंग को बनाए रखने में लगाते हैं। आज हम यहीं हैं।


एक बेहतर रास्ता है।


PostgreSQL की वापसी

यहीं से हमारी कहानी में एक नया मोड़ आता है। हमारा हीरो, एक चमकदार नया डेटाबेस होने के बजाय, एक पुराना दिग्गज है, जिसका नाम सिर्फ़ एक मदर कोर डेवलपर ही पसंद कर सकता है: PostgreSQL।


पहले, PostgreSQL, MySQL से बहुत पीछे दूसरे नंबर पर था। MySQL का उपयोग करना आसान था, इसके पीछे एक कंपनी थी, और इसका नाम कोई भी आसानी से बोल सकता था। लेकिन फिर MySQL को सन माइक्रोसिस्टम्स (2008) ने अधिग्रहित कर लिया, जिसे बाद में Oracle (2009) ने अधिग्रहित कर लिया। और सॉफ्टवेयर डेवलपर्स, जिन्होंने MySQL को महंगी Oracle तानाशाही से मुक्त उद्धारकर्ता के रूप में देखा, ने पुनर्विचार करना शुरू कर दिया कि क्या उपयोग किया जाए।


उसी समय, डेवलपर्स का एक वितरित समुदाय, जिसे मुट्ठी भर छोटी स्वतंत्र कंपनियों द्वारा प्रायोजित किया गया था, धीरे-धीरे PostgreSQL को बेहतर और बेहतर बना रहा था। उन्होंने चुपचाप शक्तिशाली सुविधाएँ जोड़ीं, जैसे कि पूर्ण-पाठ खोज (2008), विंडो फ़ंक्शन (2009), और JSON समर्थन (2012)। उन्होंने स्ट्रीमिंग प्रतिकृति, हॉट स्टैंडबाय, इन-प्लेस अपग्रेड (2010), लॉजिकल प्रतिकृति (2017) जैसी क्षमताओं के माध्यम से और बग्स को परिश्रमपूर्वक ठीक करके और खुरदुरे किनारों को चिकना करके डेटाबेस को और भी अधिक ठोस बना दिया।

PostgreSQL अब एक प्लेटफ़ॉर्म है

इस समय के दौरान PostgreSQL में जोड़ी गई सबसे प्रभावशाली क्षमताओं में से एक एक्सटेंशन का समर्थन करने की क्षमता थी: सॉफ्टवेयर मॉड्यूल जो PostgreSQL में कार्यक्षमता जोड़ते हैं (2011)। एक्सटेंशन ने और भी अधिक डेवलपर्स को PostgreSQL में कार्यक्षमता जोड़ने में सक्षम बनाया स्वतंत्र रूप से, शीघ्रता से, और न्यूनतम समन्वय के साथ।


एक्सटेंशन की बदौलत PostgreSQL सिर्फ़ एक बेहतरीन रिलेशनल डेटाबेस से कहीं बढ़कर बनने लगा। PostGIS की बदौलत यह एक बेहतरीन जियोस्पेशियल डेटाबेस बन गया; TimescaleDB की बदौलत यह एक बेहतरीन टाइम-सीरीज़ डेटाबेस बन गया; hstore, एक की-वैल्यू स्टोर; AGE, एक ग्राफ़ डेटाबेस; pgvector, एक वेक्टर डेटाबेस। PostgreSQL एक प्लैटफ़ॉर्म बन गया।


अब, डेवलपर्स PostgreSQL का उपयोग इसकी विश्वसनीयता, मापनीयता (गैर-संबंधपरक डेटाबेस की जगह), डेटा विश्लेषण (डेटा वेयरहाउस की जगह) और अन्य के लिए कर सकते हैं।

बिग डेटा के बारे में क्या?

इस बिंदु पर, समझदार पाठक को पूछना चाहिए, "बड़े डेटा के बारे में क्या?" यह एक उचित सवाल है। ऐतिहासिक रूप से, "बड़ा डेटा" (उदाहरण के लिए, सैकड़ों टेराबाइट्स या यहां तक कि पेटाबाइट्स) - और संबंधित एनालिटिक्स क्वेरीज़ - PostgreSQL जैसे डेटाबेस के लिए एक खराब फिट रहे हैं जो अपने आप क्षैतिज रूप से स्केल नहीं करता है।


यह भी बदल रहा है। पिछले नवंबर में, हमने " स्तरित भंडारण , जो स्वचालित रूप से आपके डेटा को डिस्क और ऑब्जेक्ट स्टोरेज (S3) के बीच स्तरित करता है, प्रभावी रूप से एक अनंत तालिका रखने की क्षमता पैदा करता है।


इसलिए, जबकि "बिग डेटा" ऐतिहासिक रूप से PostgreSQL के लिए कमजोरी का क्षेत्र रहा है, जल्द ही, कोई भी कार्यभार बहुत बड़ा नहीं होगा।


PostgreSQL ही इसका उत्तर है। PostgreSQL ही वह तरीका है जिससे हम खुद को मुक्त कर सकते हैं और भविष्य का निर्माण कर सकते हैं।


स्वयं को मुक्त करें, भविष्य का निर्माण करें, PostgreSQL को अपनाएं

कई अलग-अलग डेटाबेस सिस्टम के साथ काम करने के बजाय, जिनमें से प्रत्येक की अपनी विशिष्टताएँ और क्वेरी भाषाएँ हैं, हम दुनिया के सबसे बहुमुखी और संभवतः सबसे विश्वसनीय डेटाबेस पर भरोसा कर सकते हैं: PostgreSQL। हम प्लंबिंग पर कम समय और भविष्य के निर्माण पर अधिक समय व्यतीत कर सकते हैं।


और PostgreSQL लगातार बेहतर होता जा रहा है। PostgreSQL समुदाय कोर को बेहतर बनाने में लगा हुआ है। आज PostgreSQL में योगदान देने वाली कई और कंपनियाँ हैं, जिनमें हाइपरस्केलर भी शामिल हैं।


आज का PostgreSQL पारिस्थितिकी तंत्र ( स्रोत )


इसके अलावा, PostgreSQL के अनुभव को बेहतर बनाने के लिए कोर के इर्द-गिर्द अधिक नवीन, स्वतंत्र कंपनियां भी काम कर रही हैं: सुपबेस (2020) PostgreSQL को वेब और मोबाइल डेवलपर्स के लिए एक व्यवहार्य फायरबेस विकल्प बना रहा है; नियोन (2021) और ज़ाटा (2022) दोनों आंतरायिक सर्वर रहित कार्यभार के लिए PostgreSQL को स्केल-टू-ज़ीरो बना रहे हैं; टेम्बो (2022) विभिन्न उपयोग मामलों के लिए आउट-ऑफ-द-बॉक्स स्टैक प्रदान कर रहा है; नील (2023) SaaS अनुप्रयोगों के लिए PostgreSQL को आसान बना रहा है; और भी बहुत कुछ।


और, निःसंदेह, हम भी हैं, समय-सीमा (2017).


टाइमस्केल की शुरुआत “टाइम सीरीज़ के लिए पोस्टग्रेएसक्यूएल” के रूप में हुई

टाइमस्केल की कहानी शायद थोड़ी जानी-पहचानी लगेगी: हम IoT ग्राहकों के लिए कुछ कठिन सेंसर डेटा समस्याओं को हल कर रहे थे, और हम डेटा में डूब रहे थे। इसे बनाए रखने के लिए, हमने एक जटिल स्टैक बनाया जिसमें कम से कम दो अलग-अलग डेटाबेस सिस्टम शामिल थे (जिनमें से एक टाइम-सीरीज़ डेटाबेस था)।


एक दिन, हम अपने ब्रेकिंग पॉइंट पर पहुँच गए। हमारे UI में, हम डिवाइस_टाइप और अपटाइम दोनों के आधार पर डिवाइस को फ़िल्टर करना चाहते थे। यह एक सरल SQL जॉइन होना चाहिए था। लेकिन क्योंकि हम दो अलग-अलग डेटाबेस का उपयोग कर रहे थे, इसलिए इसके बजाय हमारे दो डेटाबेस के बीच हमारे एप्लिकेशन में ग्लू कोड लिखना आवश्यक था। बदलाव करने में हमें कई सप्ताह और एक संपूर्ण इंजीनियरिंग स्प्रिंट लगने वाला था।


फिर, हमारे एक इंजीनियर के दिमाग में एक अजीबोगरीब विचार आया: क्यों न हम PostgreSQL में ही टाइम-सीरीज डेटाबेस बना लें? इस तरह, हमारे पास अपने सभी डेटा के लिए सिर्फ़ एक डेटाबेस होगा और हम सॉफ़्टवेयर को तेज़ी से शिप करने के लिए स्वतंत्र होंगे। फिर हमने इसे बनाया, और इसने हमारी ज़िंदगी को बहुत आसान बना दिया। फिर हमने अपने दोस्तों को इसके बारे में बताया, और वे इसे आज़माना चाहते थे। और हमें एहसास हुआ कि यह कुछ ऐसा था जिसे हमें दुनिया के साथ साझा करने की ज़रूरत थी।


इसलिए, हमने अपने टाइम-सीरीज़ एक्सटेंशन, टाइमस्केलडीबी, और दुनिया को इसकी घोषणा की 4 अप्रैल, 2017 को। उस समय, PostgreSQL-आधारित स्टार्टअप काफी दुर्लभ थे। हम पहले लोगों में से एक थे।


पिछले सात वर्षों में, हमने एक्सटेंशन और अपनी PostgreSQL क्लाउड सेवा दोनों में भारी निवेश किया है, जिससे समय-श्रृंखला और विश्लेषण के लिए बेहतर से बेहतर PostgreSQL डेवलपर अनुभव की पेशकश हुई है: 350 गुना तेज क्वेरी, हाइपरटेबल्स (स्वतः विभाजन तालिका) के माध्यम से 44% उच्च प्रविष्टियां; निरंतर समुच्चय (वास्तविक समय भौतिक दृश्य) के माध्यम से सामान्य क्वेरी के लिए मिलीसेकंड प्रतिक्रिया समय; मूल स्तंभ संपीड़न के माध्यम से 90% से अधिक भंडारण लागत की बचत; स्तरित भंडारण के माध्यम से अनंत, कम लागत वाली वस्तु भंडारण; और भी बहुत कुछ।


समय श्रृंखला से परे विस्तारित समय-सीमा

यहीं से हमने शुरुआत की थी, समय-श्रृंखला डेटा के मामले में, और इसी के लिए हम सबसे ज्यादा जाने जाते हैं।


लेकिन पिछले साल हमने विस्तार करना शुरू कर दिया।

टाइमस्केल वेक्टर

हमने लॉन्च किया टाइमस्केल वेक्टर (“AI अनुप्रयोगों के लिए PostgreSQL++”), जो PostgreSQL को और भी बेहतर वेक्टर डेटाबेस बनाता है। टाइमस्केल वेक्टर 100 मिलियन से अधिक वेक्टर तक स्केल करता है, जो pgvector पर और भी बेहतर प्रदर्शन करता है। नवोन्मेषी कंपनियाँ और टीमें पहले से ही बड़े पैमाने पर उत्पादन में टाइमस्केल वेक्टर का उपयोग कर रही हैं, जिसमें शामिल हैं ओपनसॉस्ड , एक GitHub इवेंट इनसाइट्स प्लेटफ़ॉर्म, 100+ मिलियन वैक्टर पर; विएरैली , एक सामाजिक वायरलिटी भविष्यवाणी मंच, 100+ मिलियन वैक्टर पर; और मार्केटरीडर , एक वित्तीय अंतर्दृष्टि मंच, 30+ मिलियन वैक्टर पर।


टाइमस्केल वेक्टर pgvector को बढ़ाता है। सीखने और बनाए रखने की परेशानी के बिना एक विशेष वेक्टर डेटाबेस का प्रदर्शन प्राप्त करें।

पॉपएसक्यूएल

हाल ही में, हमने PopSQL का भी अधिग्रहण किया सर्वश्रेष्ठ PostgreSQL UI बनाने और पेश करने के लिए। PopSQL टीम सहयोग के लिए SQL संपादक है, जिसमें ऑटोकम्प्लीट, स्कीमा एक्सप्लोरेशन, वर्जनिंग और विज़ुअलाइज़ेशन है। सैकड़ों हज़ारों डेवलपर्स और डेटा विश्लेषकों ने अपने डेटा के साथ काम करने के लिए PopSQL का उपयोग किया है, चाहे वह PostgreSQL, Timescale, या Redshift, Snowflake, BigQuery, MySQL, SQL Server, और अन्य जैसे अन्य डेटा स्रोतों पर हो।



PopSQL टीम सहयोग के लिए SQL संपादक है

इनसाइट्स

हमने “ इनसाइट्स, "हमारा अब तक का सबसे बड़ा डॉगफूडिंग प्रयास , जो डेवलपर्स को डेटाबेस प्रदर्शन की निगरानी और अनुकूलन करने में मदद करने के लिए प्रत्येक डेटाबेस क्वेरी को ट्रैक करता है। इनसाइट्स pg_stat_statements (आपके डेटाबेस से आँकड़े देखने के लिए आधिकारिक एक्सटेंशन) की कई सीमाओं को दूर करता है। पैमाना बहुत बड़ा है और यह हमारे उत्पाद (और टीम) की क्षमता का प्रमाण है: एक ट्रिलियन से अधिक सामान्यीकृत क्वेरीज़ (यानी, क्वेरीज़ जिनके पैरामीटर मानों को प्लेसहोल्डर्स द्वारा बदल दिया गया है) को एकत्र, संग्रहीत और विश्लेषित किया गया है, जिसमें हर दिन 10 बिलियन से अधिक नई क्वेरीज़ शामिल की जाती हैं।


टाइमस्केल अब “PostgreSQL को शक्तिशाली बनाया गया है”

आज, टाइमस्केल PostgreSQL को किसी भी पैमाने पर शक्तिशाली बना देता है। अब हम कठिन डेटा समस्याओं को हल करते हैं - जो कोई और नहीं कर सकता - न केवल समय श्रृंखला में बल्कि एआई, ऊर्जा, गेमिंग, मशीन डेटा, इलेक्ट्रिक वाहन, अंतरिक्ष, वित्त, वीडियो, ऑडियो, वेब 3, और बहुत कुछ में।



हमारा मानना है कि डेवलपर्स को हर काम के लिए PostgreSQL का उपयोग करना चाहिए, और हम PostgreSQL में सुधार कर रहे हैं ताकि वे ऐसा कर सकें।


ग्राहक Timescale का उपयोग न केवल अपने समय-श्रृंखला डेटा के लिए करते हैं, बल्कि अपने वेक्टर डेटा और सामान्य संबंधपरक डेटा के लिए भी करते हैं। वे Timescale का उपयोग इसलिए करते हैं ताकि वे PostgreSQL का उपयोग हर चीज़ के लिए कर सकें। आप भी कर सकते हैं: यहां निःशुल्क आरंभ करें .


कोडा: योदा?

हमारी मानवीय वास्तविकता, भौतिक और आभासी, ऑफ़लाइन और ऑनलाइन, डेटा से भरी हुई है। जैसा कि योदा कह सकते हैं, डेटा हमें घेरता है, हमें बांधता है। यह वास्तविकता तेजी से सॉफ्टवेयर द्वारा नियंत्रित होती है, सॉफ्टवेयर डेवलपर्स द्वारा लिखी जाती है, हमारे द्वारा।


यह सराहनीय है कि यह कितना उल्लेखनीय है। बहुत समय पहले की बात नहीं है, 2002 में, जब मैं एमआईटी में स्नातक छात्र था, दुनिया ने सॉफ्टवेयर में विश्वास खो दिया था। हम डॉटकॉम बबल के पतन से उबर रहे थे। प्रमुख व्यावसायिक प्रकाशनों ने घोषणा की कि " कोई फर्क नहीं पड़ता कि ." उस समय, एक सॉफ्टवेयर डेवलपर के लिए प्रौद्योगिकी की तुलना में वित्त में अच्छी नौकरी पाना आसान था - और यही मेरे कई एमआईटी सहपाठियों ने किया, जिनमें मैं भी शामिल था।


लेकिन आज, खास तौर पर जनरेटिव एआई की इस दुनिया में, हम ही भविष्य को आकार दे रहे हैं। हम ही भविष्य के निर्माता हैं। हमें खुद पर चुटकी लेनी चाहिए।


हर चीज़ कंप्यूटर बन रही है। यह काफी हद तक एक अच्छी बात रही है: हमारी कारें सुरक्षित हैं, हमारे घर ज़्यादा आरामदायक हैं, और हमारे कारखाने और खेत ज़्यादा उत्पादक हैं। हमारे पास पहले से कहीं ज़्यादा जानकारी तक तुरंत पहुँच है। हम एक-दूसरे से ज़्यादा जुड़े हुए हैं। कई बार, इसने हमें स्वस्थ और खुश भी बनाया है।


लेकिन हमेशा ऐसा नहीं होता। बिजली की तरह, कंप्यूटिंग का भी एक उज्ज्वल और एक अंधकारमय पक्ष है। इस बात के प्रमाण बढ़ रहे हैं कि मोबाइल फोन और सोशल मीडिया सीधे तौर पर एक दूसरे के साथ जुड़ने में योगदान दे रहे हैं। किशोरों में मानसिक बीमारी की वैश्विक महामारी हम अभी भी इसके निहितार्थों से जूझ रहे हैं कृत्रिम बुद्धि (AI) और सिंथेटिक जीवविज्ञान जब हम अपनी महान शक्ति को स्वीकार करते हैं, तो हमें यह भी समझना चाहिए कि इसके साथ जिम्मेदारी भी आती है।


हम दो मूल्यवान संसाधनों के संरक्षक बन गए हैं जो भविष्य के निर्माण को प्रभावित करते हैं: हमारा समय और हमारी ऊर्जा।


हम या तो उन संसाधनों को पाइपलाइन के प्रबंधन पर खर्च करने का विकल्प चुन सकते हैं या फिर हर चीज के लिए PostgreSQL को अपना सकते हैं और सही भविष्य का निर्माण कर सकते हैं।


मुझे लगता है कि आप जानते हैं कि हम कहां खड़े हैं।


पढ़ने के लिए धन्यवाद। #Postgres4Life


( स्रोत )


यह पोस्ट अजय कुलकर्णी द्वारा लिखी गई थी।