फीचर इमेज को मिडजर्नी डिफ्यूजन के साथ "एक अजगर प्रबल होता है, डिजिटल फंतासी कला" के साथ तैयार किया गया था। डेटा साइंस के बारे में डेटा साइंस वह जगह है जहाँ सांख्यिकी, प्रोग्रामिंग और संचार प्रतिच्छेद करते हैं। एक डेटा वैज्ञानिक एक प्रश्न पूछता है और विभिन्न जटिलताओं के तंत्र के माध्यम से उस प्रश्न का उत्तर देने के लिए डेटा का उपयोग करता है। उनके पास यह जानने के लिए ज्ञान और टूलकिट है कि प्रत्येक डेटा प्रकार पर कौन से परीक्षण और तरीके लागू करने हैं। और उनके पास डेटा से उत्तर निकालने और उन उत्तरों को संचार के सामान्य रोजमर्रा के रूप में रिले करने की क्षमता है। डेटा सरल से बेतहाशा जटिल तक हो सकता है। यह "साफ" हो सकता है और यह "गन्दा" हो सकता है। कभी-कभी हमारे पास एक प्रश्न होता है, लेकिन हमारे पास डेटा नहीं होता है। एक डेटा वैज्ञानिक और/या विश्लेषक को विशेष उपकरणों का उपयोग करके गंदे डेटा को स्वच्छ डेटा में बदलना चाहिए। वे भी विकास कर सकते हैं' ' प्रोग्राम जो डेटा जाने और लाने के लिए डिज़ाइन किए गए हैं यदि उनके पास उनके प्रश्न का उत्तर देने के लिए आवश्यक नहीं है। एक बार जब डेटा प्राप्त हो जाता है और प्रयोग करने योग्य रूप में होता है, तो इसे कार्यक्रमों और उपकरणों जैसे कि पायथन, RStudio, आदि के माध्यम से सांख्यिकीय परीक्षणों और मॉडलों में धकेल दिया जाता है। लेकिन कौन से उपकरण सबसे अच्छे हैं? स्क्रैपिंग हैकरनून के पाठक हैकरनून के (10/4/2023 से 16/4/2023) का उपयोग यह आकलन करने के लिए किया गया था कि हमारे पाठक इस विषय पर कहां गिरते हैं। हैकरनून समुदाय से पूछा गया कि उनका वर्कहॉर्स डेटा साइंस टूल क्या है, कुछ सबसे लोकप्रिय विकल्प दिए गए और 374 लोगों ने जवाब दिया। परिणाम नीचे दी गई छवि में देखे जा सकते हैं: साप्ताहिक चुनाव हैकरनून के 50% से अधिक पाठक, जो बड़े पैमाने पर प्रौद्योगिकी समुदाय से हैं, ने अपने गो-टू डेटा साइंस टूल के रूप में पायथन को चुना। यह सब आश्चर्यजनक नहीं है। ओपन-सोर्स है जो इसे सभी के लिए सुलभ बनाता है 🙂🙃🙂🙃🙂🙃🙂🙃🙂🙃🙂🙃 [ ] अजगर 18% चयनित उनकी शीर्ष पसंद डेटा साइंस टूल के रूप में। [] एक्सेल केवल 9% मतदान उत्तरदाताओं द्वारा चुना गया**.** [ ] Power BI को एक ओपन-सोर्स टूल भी है, केवल 9% वोट लिया। [ ] आरस्टूडियो अंत में, केवल 5% ने चुना डेटा साइंस के लिए उनके गो-टू टूल के रूप में [ ] चित्रमय तसवीर औजार चुनने के लिए इतने सारे टूल क्यों हैं? समय के साथ जटिलता बढ़ती जा रही है, इसलिए स्वाभाविक रूप से उपकरणों का विकल्प भी रहा है। डेटा साइंस की इतनी सारी धाराएँ हैं कि प्रत्येक व्यक्ति को अपने लिए यह तय करना होगा कि कौन सा उपकरण उसके लिए सही है। और वास्तविक रूप से, आप एक साथ कई टूल का उपयोग करेंगे। यह क्षेत्र आइए पोल से प्रत्येक टूल की कुछ झलकियां देखें। बेशक, यहां 😆 और अधिक टूल पर चर्चा नहीं की गई है एक्सेल ❌ ओपन-सोर्स। ✅ माइक्रोसॉफ्ट तरीके से यूजर फ्रेंडली है! ❌ जटिल डेटा विज्ञान परियोजनाओं के लिए पर्याप्त उन्नत नहीं है। ✅ स्टाइलिश चार्ट और ग्राफ़ बनाता है जिन्हें आसानी से निर्यात किया जा सकता है। हम सभी एक्सेल से परिचित हैं। ज़रूर, यह रोज़मर्रा के कार्यों जैसे डेटा हेरफेर, सफाई और विज़ुअलाइज़ेशन के लिए बहुत अच्छा है, लेकिन यह अधिक उन्नत परियोजनाओं के लिए इसमें कटौती नहीं करता है। आप डैशबोर्ड और रिपोर्ट बनाने में कुशल हो सकते हैं, और आप एक्सेल के भीतर विशेष एपीआई भी सेट कर सकते हैं। rstudio ✅ ओपन-सोर्स। ❌ एक महत्वपूर्ण सीखने की अवस्था है। ✅ साफ और अनुकूलन योग्य ग्राफ, टेबल और आउटपुट उत्पन्न कर सकते हैं। ❌ कुछ अधिक उन्नत मशीन लर्निंग टूल्स में सीमित किया जा सकता है। ✅ सांख्यिकीय आधारित समस्याओं के लिए विशेष। एक बहुमुखी ओपन-सोर्स प्रोग्राम है जो डेटा एनालिटिक्स और डेटा साइंस के लिए उत्कृष्ट है , जो अब चमकदार नए नाम से जाना जा रहा है . आरस्टूडियो किसी स्थिति में रखना ** \ पायथन के समान, आर प्रोग्रामिंग भाषा की बहुमुखी प्रतिभा विशाल है, जिससे डेटा वैज्ञानिकों को कई दृष्टिकोणों का उपयोग करके जटिल कार्य करने की अनुमति मिलती है। विशेष कार्य करने के लिए पुस्तकालय और पैकेज लगातार विकसित किए जा रहे हैं जिनका प्रोग्रामर लाभ उठा सकते हैं। और यदि उनके पास वह पैकेज नहीं है जिसकी आप तलाश कर रहे हैं, ! "हमारा मिशन डेटा विज्ञान, वैज्ञानिक अनुसंधान और तकनीकी संचार के लिए ओपन-सोर्स सॉफ़्टवेयर बनाना है। हम आर्थिक साधनों की परवाह किए बिना, सभी के द्वारा ज्ञान के उत्पादन और उपभोग को बढ़ाने के लिए ऐसा करते हैं।" - पॉज़िट तो स्वयं एक विकसित करें आप एक दूसरे के साथ कर सकते हैं। यदि आप आर और पायथन प्रोग्रामर के साथ एक सहयोगी परियोजना पर काम कर रहे हैं तो इसे देखें। मिलकर R और Python का उपयोग पावर बीआई ❌ ओपन-सोर्स। ✅ सुंदर रिपोर्ट बनाता है। ❌ उपयोग में आसान प्रतीत हो सकता है, लेकिन इसमें छिपी हुई जटिलता है। ✅ डेटा तकरार और हेरफेर के लिए बढ़िया। ❌ जटिल डेटा विज्ञान परियोजनाओं के लिए सीमित क्षमताएं। ✅विभिन्न स्रोतों से डेटा स्क्रैप कर सकते हैं। Power BI वास्तव में एक के रूप में चमकता है डेटा साइंस के लिए वर्कहॉर्स टूल के बजाय। यह अनुरूपित कोडित संचालन जैसे नियमित अभिव्यक्ति आदि के माध्यम से विशेष डेटा जोड़तोड़ करने की क्षमता रखता है, लेकिन संभावना है, यदि आप एक जटिल डेटा विज्ञान परियोजना पर काम कर रहे हैं, तो आप परियोजना के अंतिम चरण में Power BI का अधिक से अधिक उपयोग करेंगे। एक प्रस्तुति उपकरण का। डेटा विज़ुअलाइज़ेशन और रिपोर्ट टूल अजगर ✅ ओपन-सोर्स। ❌ एक महत्वपूर्ण सीखने की अवस्था है। ✅ साफ-सुथरे ग्राफ, टेबल और आउटपुट बना सकते हैं। ✅ कई डेटा साइंस लाइब्रेरी हैं जैसे TensorFlow, Scikit-learn, NumPy, Pandas, PyTorch, आदि। ✅ एक बहुउद्देश्यीय प्रोग्रामिंग भाषा है जो आपके सीखने के प्रयासों को और आगे ले जाती है। एक वस्तु उन्मुख, बहुउद्देश्यीय प्रोग्रामिंग भाषा है। यह सीखने में आसान और बहुमुखी प्रोग्रामिंग भाषा होने के लिए जाना जाता है। इसकी बहुमुखी प्रतिभा के कारण, प्रोग्रामरों का एक विशाल समुदाय है, इस प्रकार शैक्षिक संसाधन कभी समाप्त नहीं होते हैं। की भरमार है जो इस्तेमाल के लिए तैयार हैं। अजगर डेटा साइंस लाइब्रेरी पायथन के साथ काम करने के लिए, आप सीखना चाहेंगे कि एक कैसे स्थापित किया जाए और आप अपना काम करने के लिए जैसे कंप्यूटिंग प्लेटफॉर्म को चुनना चाहेंगे। आभासी वातावरण ज्यूपिटर नोटबुक चित्रमय तसवीर ❌ ओपन-सोर्स। ✅ सुंदर डैशबोर्ड बनाता है। ❌ सीमित डेटा पूर्व-प्रसंस्करण क्षमताएं जैसे सफाई और तकरार। ✅ डेटा एनालिटिक्स के लिए बढ़िया। ❌ जटिल डेटा विज्ञान परियोजनाओं के लिए सीमित क्षमताएं। ✅ रिपोर्ट और डैशबोर्ड दूसरों के साथ आसानी से साझा किए जा सकते हैं। एक उत्कृष्ट डेटा एनालिटिक्स और विज़ुअलाइज़ेशन सॉफ़्टवेयर है जो अक्सर इसकी लागत के कारण बड़ी टीमों में उपयोग किया जाता है। यह सुंदर और सहज प्रस्तुति शैली के डैशबोर्ड बना सकता है जो आपके डेटा के विभिन्न पहलुओं को उजागर कर सकता है। यह निश्चित रूप से वर्कहॉर्स टूल नहीं है, क्योंकि यह रिपोर्टिंग चरणों में अधिक विशिष्ट है और डेटा प्रोजेक्ट की शुरुआत और मध्य चरणों में नहीं है। चित्रमय तसवीर अंतिम विचार हमारे सर्वेक्षण से पता चला है कि डेटा साइंस टूल्स के लिए दिए गए विकल्पों में से पायथन शीर्ष पर पहुंच गया है। इसकी बहुमुखी प्रतिभा को देखते हुए, डेटा विज्ञान क्षेत्र के भीतर और बाहर, यह कोई आश्चर्य की बात नहीं थी। पायथन को प्रोग्रामिंग भाषा सीखने में आसान माना जाता है। चलो ईमानदार रहें, यदि आप कंप्यूटर कोडिंग के लिए एक पूर्ण शुरुआत कर रहे हैं, तो यह पहली बार में " " नहीं होगा, लेकिन अभ्यास के साथ, अंततः यह आपके लिए दूसरा स्वभाव बन जाएगा। आसान कृपया टिप्पणियों में अपने विचार साझा करें और भाग लेने के लिए अन्य पर नज़र रखें। हैकरनून पोल