Technologist, Social Impact, Data Ethics, AI
The is an opinion piece based on the author’s POV and does not necessarily reflect the views of HackerNoon.
मैले भर्खरै साइबरसुरक्षाको लागि डेटा विज्ञान प्रयोग गर्ने कक्षा सञ्चालन गरें, प्याकेट क्याप्चर डेटाको विश्लेषणमा केन्द्रित हुँदै - केही हदसम्म प्राविधिक र परम्परागत रूपमा सुख्खा विषय। मैले साझा गरेको दृष्टिकोणले वित्तीय संस्थाहरू भित्र साइबरसुरक्षामा मेरो अनुभवबाट लिएको हो, अन्वेषण डेटा विश्लेषण, पूर्व-प्रक्रिया र लग डेटा रूपान्तरण, र क्लस्टरिङ र ग्राफ नेटवर्क विश्लेषणको संयोजन मार्फत विसंगतिहरू पहिचान गर्ने जस्ता मुख्य चरणहरू समावेश गर्दछ।
एउटा अचम्मको पक्ष भनेको मैले यस सत्रको तयारीमा बिताएको समय थियो - मैले सामान्यतया लगानी गर्ने कुराको एक अंश। AI ले प्रक्रियालाई सुव्यवस्थित बनाउन महत्त्वपूर्ण भूमिका खेलेको छ। मैले क्लाउडलाई कोडिङमा सहयोग गर्न, रूपरेखा विकास गर्न र स्लाइडहरू सिर्जना गर्न प्रयोग गरें। कुलमा, सम्पूर्ण पाठ्यक्रम 48 घण्टा भित्र तयार थियो।
सत्र आकर्षक सावित भयो। सहभागीहरू, मुख्यतया CISOs जसले सामान्यतया कोड गर्दैनन्, अभ्यासहरू भेट्टाए, AI को सहयोगमा बनाइएको, सहज र ह्यान्ड-अन हुन। मेरो लक्ष्य डेटा र कोड संग प्रत्यक्ष काम मा तिनीहरूलाई डुबाउनु थियो। तिनीहरूले विशेष गरी आधुनिक साइबर थ्रेट निगरानी र SIEM प्लेटफर्महरू सामान्यतया स्वचालित रूपमा "हुडमुनि" भइरहेका प्रक्रियाहरूमा अन्तर्दृष्टि प्राप्त गर्दै म्यानुअल रूपमा अन्वेषण गर्ने मौकाको प्रशंसा गरे।
कक्षाबाट मेरो कुञ्जी टेकवे आश्चर्यजनक रूपमा काउन्टरइन्ट्युटिभ थियो: डेटा विज्ञान, हामीलाई थाहा छ, अन्ततः AI द्वारा प्रतिस्थापित हुनेछ । यो दृष्टिकोण समय भन्दा पहिले जस्तो लाग्न सक्छ - वा सायद यसको समय भन्दा अगाडि - तर यो एक परिप्रेक्ष्य हो जसले छलफलको वारेन्टी गर्दछ।
चेतावनी: यसले मानिसहरूलाई ट्रिगर गर्न सक्छ।
एक दशक भन्दा बढीको लागि, डेटा विज्ञान "21 औं शताब्दीको सबैभन्दा सेक्सी काम" को रूपमा मनाइन्छ। यद्यपि AI द्रुत रूपमा अगाडि बढ्दै जाँदा, यो स्पष्ट हुँदै गइरहेको छ कि क्षेत्रका अन्तर्निहित चुनौतीहरूलाई बेवास्ता गर्न गाह्रो छ। शक्तिशाली जेनेरेटिभ एआईको आगमन अनुशासनको लागि धेरै राम्रो तरिकाले टिपिङ बिन्दु हुन सक्छ जुन, पछिल्तिर हेर्दा, सुरुमा स्वीकार गरिएको भन्दा धेरै ढिलो रूपमा परिभाषित र ओभरहाइप गरिएको हुन सक्छ।
यसको सारमा, डाटा विज्ञानले कम्प्युटर विज्ञान, तथ्याङ्क, र व्यापारिक ज्ञानलाई संयोजन गर्दछ, संगठनहरूलाई ठूलो मात्रामा डाटाबाट कार्ययोग्य अन्तर्दृष्टिहरूको वाचा प्रदान गर्दछ। यो कौशलसेट आजको डाटा-संचालित संसारमा निर्विवाद रूपमा मूल्यवान छ। यद्यपि, यसको पॉलिश छवि मुनि, क्षेत्रले महत्त्वपूर्ण समस्याहरूको सामना गर्दछ। डेटा विज्ञानको रूपमा प्राय: जसलाई लेबल गरिन्छ त्यो प्रायः ढिलो सम्बन्धित कार्यहरूको प्याचवर्क हो जुन सधैं सफासँग पङ्क्तिबद्ध हुँदैन, र क्षेत्रका धेरै पेशेवरहरूले अनुशासनको माग गरेको पूर्ण चौडाइ र जटिलतासँग संघर्ष गर्छन्।
डाटा विश्लेषण, मोडलिङ, र अन्तरदृष्टि जेनेरेसन ह्यान्डल गर्न सक्षम AI-संचालित उपकरणहरूको उदयले हामी कसरी डेटा विज्ञानको भूमिका र भविष्यलाई हेर्छौं भनेर परिवर्तन गर्न बाध्य पार्न सक्छ। AI ले डाटा विज्ञान भित्रका धेरै आधारभूत कार्यहरूलाई सरल र स्वचालित गर्न जारी राख्दा, फिल्डले बौद्धिक स्वचालनको युगमा डाटा वैज्ञानिक हुनुको वास्तविक अर्थ के हो भनेर गणनाको सामना गर्नुपर्ने हुन सक्छ।
धेरै डेटा वैज्ञानिकहरू, परिष्कृत कोडिङ सीपहरू र डिजिटल उपकरणहरू प्रयोग गरे तापनि, आश्चर्यजनक रूपमा म्यानुअल र त्रुटिको सम्भावना भएको काममा संलग्न हुन्छन्। डाटा तयारी, सफाई, र विश्लेषणमा दोहोरिने र मेकानिकल हुने थकाइलाग्दो, समय-उपभोग गर्ने कार्यहरू समावेश हुन्छन्। वास्तवमा, डेटा साइंस श्रमको एक महत्वपूर्ण मात्रा डेटासेटहरू तयार गर्नमा जान्छ - एक कार्य जुन प्रायः रोमाञ्चक, खोज-संचालित विज्ञान भन्दा बढी कठिनाइ जस्तो लाग्छ। यो समस्या यस तथ्यले बढेको छ कि फिल्डमा प्रवेश गर्नेहरू धेरैजसो, एमेच्योरहरू हुन्। पाइथन वा आरमा केही अनलाइन पाठ्यक्रमहरू लिएर, यी "डेटा वैज्ञानिकहरू" भूमिकाको कठोरताका लागि प्रायः तयार हुँदैनन् । डाटा विज्ञान कोडिङ मात्र होइन। यसले गहिरो विश्लेषण, प्रासंगिक समझ, र गैर-प्राविधिक दर्शकहरूलाई अन्तर्दृष्टि प्रस्तुत गर्ने क्षमता समावेश गर्दछ। वास्तवमा, यो एक अनुसन्धान कार्य हो, रचनात्मकता र विश्लेषणात्मक सोच को मिश्रण को आवश्यकता छ कि क्षेत्र मा धेरै मात्र स्वामित्व छैन।
यसबाहेक, धेरै डेटा वैज्ञानिकहरूले अधिकारको भावना विकास गरेका छन्, उच्च तलब र आकर्षक प्याकेजहरू केवल तिनीहरूको शीर्षकको आधारमा। यो मनोवृत्तिले कम्पनीहरूलाई बन्द गर्दैछ, विशेष गरी क्षेत्रहरूमा जहाँ लागत दक्षता सर्वोपरि छ। मैले फर्महरू भेटेको छु जुन एक पटक डाटा वैज्ञानिकहरू भाडामा लिन हतारिएको थियो तर अब पुनर्विचार गर्दै हुनुहुन्छ। AI ले छिटो, राम्रो र लागतको एक अंशमा गर्न सक्ने हुँदा आफ्नो अधिकांश समय डेटा क्लिनिङमा कुस्तीमा बिताउने व्यक्तिलाई किन उच्च पारिश्रमिक तिर्ने?
मैले व्यक्तिगत रूपमा क्लास लेख्ने अनुभव गरेपछि, जेनेरेटिभ एआई डेटा विज्ञान सबैभन्दा कमजोर भएको क्षेत्रहरूमा एक शक्तिशाली शक्तिको रूपमा विकसित भएको छ। डाटा तयार गर्ने, सफा गर्ने, र आधारभूत गुणात्मक विश्लेषण जस्ता कार्यहरू — डेटा वैज्ञानिकको धेरै समय खर्च गर्ने गतिविधिहरू — अब AI प्रणालीहरूद्वारा सजिलै स्वचालित हुन्छन्। के खराब छ (वा राम्रो, तपाईं कहाँ उभिनुमा निर्भर गर्दछ) यो हो कि AI छिटो, अधिक सटीक, र मानव त्रुटि वा थकान को लागी कम प्रवण छ।
धेरै डेटा वैज्ञानिकहरूको लागि, यो डरलाग्दो हुन सक्छ। आखिर, यी कार्यहरूले तिनीहरूको दिन-दिनको कामको थोक प्रतिनिधित्व गर्दछ। उदाहरणका लागि, डाटा क्लिन्जिङ कुख्यात रूपमा समय-खपत र गल्तीहरूको खतरा हो, तर AI ले अब यसलाई केही क्लिकहरू र नजिक-सही सटीकताको साथ पूरा गर्न सक्छ। डेटा वैज्ञानिकहरूले प्रायः यी ग्रन्ट कार्यहरूको बारेमा गुनासो गर्छन्, तर तिनीहरू तिनीहरूको भूमिकाको लागि आधारभूत छन्। एआई प्रणालीहरू सुधार हुँदै जाँदा, मानिसहरूलाई यी कामहरू गर्ने आवश्यकता घट्दै जान्छ। यो कुनै आश्चर्यको कुरा होइन कि AI को बिरूद्ध धेरै मुखर आलोचना डाटा वैज्ञानिकहरू आफैंबाट आउँछ । तिनीहरू भित्तामा लेखिएको देख्छन् र आफ्नो कामको लागि डराउँछन्।
डाटा वैज्ञानिकहरूका लागि मामिलाहरूलाई अझ खराब बनाउन, क्षेत्रले हालका वर्षहरूमा उल्लेखनीय प्रगति गरेको छैन। यसको लोकप्रियतामा उल्टो वृद्धि भए तापनि, डाटा विज्ञान अझै पनि असक्षमता, त्रुटिहरू, र वास्तवमा यसमा के समावेश हुनुपर्छ भन्ने स्पष्टताको अभावले ग्रस्त छ। यो एक पटक विश्वास गरिएको थियो कि अधिक परिष्कृत उपकरणहरू र राम्रो प्रशिक्षणले क्षेत्रको विकास गर्नेछ, तर यो अपेक्षित हदसम्म पूरा भएको छैन। यसको विपरित, एआई लगातार सुधार भएको छ। मेसिन लर्निङ एल्गोरिदम, प्राकृतिक भाषा प्रशोधन, र जेनेरेटिभ मोडेलहरू द्रुत रूपमा विकसित हुँदैछन्, परम्परागत डेटा विज्ञानलाई धुलोमा छोड्दै।
फेरि, डेटा वैज्ञानिकहरूको उच्च वेतन अपेक्षाहरूले मुद्दालाई जटिल बनाउँछ । एक पटक असक्षमता सहन सक्ने कम्पनीहरूले अहिले महसुस गरिरहेका छन् कि AI ले मानव श्रमसँग जोडिएको भारी मूल्य ट्याग बिना धेरै ग्रन्ट कामलाई प्रतिस्थापन गर्न सक्छ। AI विश्लेषण, पूर्वानुमान, र यहाँ सम्म कि प्रस्तुतीकरण जस्ता प्रमुख कार्यहरू प्रदर्शन गर्न मा अधिक निपुण हुँदै जाँदा, डेटा विज्ञानको म्यानुअल प्रकृति बढ्दो अनावश्यक हुँदै गइरहेको छ। धेरै कम्पनीहरूले यो महसुस गर्नेछन् कि पहिले के डाटा वैज्ञानिकहरूको टोली चाहिन्छ अब एआई-संचालित उपकरणहरू द्वारा अधिक कुशलतापूर्वक ह्यान्डल गर्न सकिन्छ।
वास्तविकता यो हो कि डेटा विज्ञान, परम्परागत रूपमा परिभाषित गरिए अनुसार, अप्रचलितताको छेउमा छ। जेनेरेटिभ एआई अचम्मको दरमा अगाडि बढ्दै गर्दा, मानव डेटा वैज्ञानिकहरूको हालको रूपमा माग घट्ने सम्भावना छ । यसले डेटा-संचालित निर्णय-निर्धारणमा मानिसहरूको कुनै भूमिका छैन भन्ने संकेत गर्दैन, तर क्लासिक "डेटा वैज्ञानिक" भूमिका चाँडै विगतको अवधारणा हुन सक्छ। अब के आवश्यक छ AI सँग सहकार्य गर्न, उच्च स्तरमा रणनीतिक सोच र जटिल समस्या समाधानमा ध्यान केन्द्रित गर्दै यसको क्षमताहरू प्रयोग गर्न कुशल पेशेवरहरू।
AI विश्लेषण, अन्तर्दृष्टि, वा निर्णय लिने को अन्त्य होइन - यसले तिनीहरूको विकासलाई प्रतिनिधित्व गर्दछ । डाटा विज्ञानको वर्तमान क्षेत्र अप्रचलित हुने जोखिममा छ यदि यो चरणमा विकसित भएन भने। एआईले पहिले नै उद्योगहरूमा क्रान्तिकारी परिवर्तन गरिरहेको छ, र डाटा विज्ञानले यस लहरलाई अनुकूलन गर्न वा जोखिममा पार्नु पर्छ। अन्ततः, प्रश्न AI ले डाटा विज्ञानलाई हटाउनेछ कि गर्दैन तर डाटा विज्ञानले आफ्नो प्रतिज्ञाहरू पूरा गर्यो कि गर्दैन।
वा हुनसक्छ यो भिन्नताले पनि फरक पार्दैन यदि हामी अन्ततः "डेटा विज्ञान" हाइप भन्दा बाहिर जान्छौं र अर्को तार्किक प्रगतिको रूपमा AI लाई अँगालो दिन्छौं।
मेरो बारेमा: 25+ वर्ष आईटी दिग्गज डेटा, एआई, जोखिम व्यवस्थापन, रणनीति, र शिक्षा संयोजन। 4x ह्याकाथन विजेता र डेटा अधिवक्ताबाट सामाजिक प्रभाव। हाल फिलिपिन्समा AI कार्यबल जम्पस्टार्ट गर्न काम गर्दै। मेरो बारेमा यहाँ थप जान्नुहोस्: https://docligot.com