Hivi majuzi nilifanya darasa la kutumia sayansi ya data kwa usalama wa mtandao, nikizingatia uchanganuzi wa data ya kunasa pakiti-mada fulani ya kiufundi na ya jadi kavu. Mbinu niliyoshiriki ilitokana na uzoefu wangu katika usalama wa mtandao ndani ya taasisi za fedha, ikijumuisha hatua za msingi kama vile uchanganuzi wa data ya uchunguzi, usindikaji wa awali na kubadilisha data ya kumbukumbu, na kutambua hitilafu kupitia mchanganyiko wa kuunganisha na kuchanganua mtandao wa grafu.
Jambo moja la kushangaza lilikuwa wakati niliotumia kujiandaa kwa kipindi hiki—sehemu ya kile ambacho ningewekeza kwa kawaida. AI ilichukua jukumu muhimu katika kurahisisha mchakato. Nilimtumia Claude kusaidia kuweka msimbo, kutengeneza muhtasari, na hata kuunda slaidi. Kwa jumla, kozi nzima ilikuwa tayari ndani ya masaa 48.
Kikao kiligeuka kuwa cha kushirikisha. Washiriki, kimsingi CISOs ambao kwa kawaida hawaandiki msimbo, walipata mazoezi, yaliyoundwa kwa usaidizi wa AI, kuwa ya angavu na ya kutekelezwa. Kusudi langu lilikuwa kuwazamisha katika kufanya kazi moja kwa moja na data na nambari. Hasa walithamini fursa ya kuchunguza wenyewe kile ambacho ufuatiliaji wa kisasa wa cyberthreat na majukwaa ya SIEM kawaida hujiendesha, kupata maarifa juu ya michakato inayofanyika "chini ya kifuniko."
Ufunguo wangu wa kuchukua kutoka kwa darasa ulikuwa wa kupingana kwa kushangaza: sayansi ya data, kama tunavyoijua, hatimaye itabadilishwa na AI . Mtazamo huu unaweza kuonekana mapema—au labda kabla ya wakati wake—lakini ni mtazamo unaohitaji mjadala.
Onyo: baadhi ya haya yanaweza kusababisha watu.
Kwa zaidi ya muongo mmoja, sayansi ya data imeadhimishwa kama "kazi ya ngono zaidi ya karne ya 21." Bado AI inapoendelea kwa kasi, inakuwa wazi kuwa changamoto za msingi za uwanja ni ngumu kupuuza. Ujio wa AI yenye nguvu ya kuzalisha inaweza kuwa kichocheo cha nidhamu ambayo, kwa kutazama nyuma, inaweza kuwa imefafanuliwa kwa njia isiyoeleweka zaidi na iliyojaa kupita kiasi kuliko ilivyokubaliwa hapo awali.
Kwa asili yake, sayansi ya data inachanganya sayansi ya kompyuta, takwimu, na ujuzi wa biashara, na kuyapa mashirika ahadi ya maarifa yanayoweza kutekelezeka kutoka kwa idadi kubwa ya data. Chombo hiki cha ujuzi kina thamani isiyoweza kuepukika katika ulimwengu wa leo unaoendeshwa na data. Walakini, chini ya picha yake iliyosafishwa, uwanja unakabiliwa na maswala muhimu. Kinachoitwa mara nyingi kama sayansi ya data mara kwa mara hubadilika na kuwa kazi ngumu inayohusiana na ambayo hailingani kila wakati kwa ustadi, na wataalamu wengi katika uwanja huo hupambana na upana na utata ambao nidhamu inadai.
Kuongezeka kwa zana zinazoendeshwa na AI zenye uwezo wa kushughulikia uchanganuzi wa data, uundaji wa muundo, na utengenezaji wa maarifa kunaweza kulazimisha mabadiliko katika jinsi tunavyoona jukumu na mustakabali wa sayansi ya data yenyewe. AI inapoendelea kurahisisha na kubinafsisha kazi nyingi za msingi ndani ya sayansi ya data, uwanja unaweza kukabiliwa na hesabu juu ya maana ya kweli ya kuwa mwanasayansi wa data katika enzi ya uhandisi wa akili.
Wanasayansi wengi wa data, licha ya kutumia ujuzi wa hali ya juu wa kuandika usimbaji na zana za kidijitali, hujishughulisha na kazi ambayo ni ya kushangaza na inayokabiliwa na makosa . Utayarishaji wa data, utakaso na uchanganuzi unahusisha kazi zenye kuchosha, zinazotumia muda mwingi na zinazorudiwa-rudiwa na za kiufundi. Kwa hakika, kiasi kikubwa cha kazi ya sayansi ya data huenda katika kuandaa hifadhidata—kazi ambayo mara nyingi huhisi kuwa ya kuchosha kuliko sayansi ya kusisimua, inayoendeshwa na ugunduzi ambayo imefanywa kuwa. Tatizo hili linachangiwa na ukweli kwamba wengi wanaoingia kwenye uwanja huo ni wasomi. Baada ya kuchukua kozi chache mkondoni huko Python au R, "wanasayansi hawa wa data" mara nyingi huwa hawajajiandaa kwa ugumu wa jukumu . Sayansi ya data sio kusimba tu. Inahusisha uchanganuzi wa kina, uelewa wa muktadha, na uwezo wa kuwasilisha maarifa kwa hadhira isiyo ya kiufundi. Kwa kweli, ni zaidi ya kazi ya utafiti, inayohitaji mchanganyiko wa ubunifu na mawazo ya uchanganuzi ambayo wengi katika uwanja hawana.
Zaidi ya hayo, wanasayansi wengi wa data wamekuza hali ya kustahiki, wakitarajia mishahara mikubwa na vifurushi vyenye faida kubwa kwa mujibu wa cheo chao. Mtazamo huu unazima kampuni, haswa katika sekta ambazo ufanisi wa gharama ni muhimu. Nimekutana na makampuni ambayo hapo awali yalikimbilia kuajiri wanasayansi wa data lakini sasa yanafikiria upya. Kwa nini ulipe mishahara mikubwa kwa mtu ambaye anatumia muda mwingi kushindana na kusafisha data, wakati AI inaweza kuifanya haraka, bora, na kwa sehemu ya gharama?
Kama nilivyojionea mwenyewe kuandika darasa, Generative AI imeibuka kuwa nguvu yenye nguvu katika maeneo ambayo sayansi ya data ni dhaifu zaidi. Kazi kama vile utayarishaji wa data, kusafisha na hata uchanganuzi wa kimsingi wa ubora—shughuli zinazotumia muda mwingi wa mwanasayansi wa data—sasa zinaendeshwa kiotomatiki na mifumo ya AI . Mbaya zaidi (au bora zaidi, kulingana na mahali unaposimama) ni kwamba AI ni ya haraka, sahihi zaidi, na haiwezi kukabiliwa na makosa au uchovu wa kibinadamu.
Kwa wanasayansi wengi wa data, hii inaweza kuwa ya kutisha. Baada ya yote, kazi hizi zinawakilisha sehemu kubwa ya kazi yao ya kila siku. Usafishaji wa data, kwa mfano, unatumia wakati mwingi na huathirika na makosa, lakini AI sasa inaweza kuikamilisha kwa kubofya mara chache na usahihi wa karibu kabisa. Wanasayansi wa data mara nyingi hulalamika kuhusu kazi hizi za grunt, lakini ni muhimu kwa majukumu yao. Mifumo ya AI inapoboreka, hitaji la wanadamu kufanya kazi hizi linapungua. Haishangazi kwamba ukosoaji mwingi wa sauti dhidi ya AI hutoka kwa wanasayansi wa data wenyewe . Wanaona maandishi ukutani na kuogopa kazi zao.
Ili kufanya mambo kuwa mabaya zaidi kwa wanasayansi wa data, uwanja huo haujafanya maendeleo makubwa katika miaka ya hivi karibuni. Licha ya umaarufu wake wa hali ya hewa, sayansi ya data bado inakabiliwa na uzembe, makosa, na ukosefu wa ufafanuzi juu ya nini inapaswa kuhusisha . Wakati fulani iliaminika kuwa zana za kisasa zaidi na mafunzo bora yangebadilisha uwanja huo, lakini hii haijatekelezwa kwa kiwango kinachotarajiwa. Kinyume chake, AI imeboreshwa kwa kasi. Kanuni za ujifunzaji wa mashine, uchakataji wa lugha asilia, na miundo zalishaji inabadilika kwa kasi, na kuacha sayansi ya data ya kitamaduni ikiwa katika vumbi.
Tena, matarajio ya juu ya mishahara ya wanasayansi wa data huchanganya suala hilo . Makampuni ambayo yangeweza kuvumilia uzembe sasa yanatambua kuwa AI inaweza kuchukua nafasi ya kazi nyingi za kununa bila lebo ya bei kubwa inayohusishwa na kazi ya binadamu. Huku AI ikizidi kuwa mahiri katika kufanya kazi muhimu kama vile uchanganuzi, utabiri, na hata uwasilishaji, asili ya mwongozo ya sayansi ya data inazidi kuwa duni. Makampuni mengi yatatambua kwamba kile kilichokuwa kikihitaji timu ya wanasayansi wa data sasa kinaweza kushughulikiwa kwa ufanisi zaidi na zana zinazoendeshwa na AI.
Ukweli ni kwamba sayansi ya data, kama inavyofafanuliwa jadi, iko kwenye ukingo wa kupitwa na wakati. Huku AI ya uzalishaji ikiongezeka kwa kasi ya kushangaza, hitaji la wanasayansi wa data ya binadamu katika hali yao ya sasa huenda likapungua . Hii haimaanishi kuwa wanadamu hawana jukumu lolote katika kufanya maamuzi yanayotokana na data, lakini jukumu la kawaida la "mwanasayansi wa data" hivi karibuni linaweza kuwa dhana ya zamani. Kinachohitajika sasa ni wataalamu walio na ujuzi katika kushirikiana na AI, kutumia uwezo wake huku wakizingatia mawazo ya kimkakati na utatuzi changamano wa matatizo katika ngazi ya juu.
AI sio mwisho wa uchanganuzi, maarifa, au kufanya maamuzi—inawakilisha mageuzi yao . Uga wa sasa wa sayansi ya data unahatarisha kutotumika ikiwa hautabadilika kwa hatua. AI tayari inaleta mapinduzi katika tasnia, na sayansi ya data lazima ibadilike au ihatarishe kupitwa na wimbi hili. Hatimaye, swali linaweza lisiwe ikiwa AI itaondoa sayansi ya data lakini ikiwa sayansi ya data iliwahi kutolewa kikamilifu kwa ahadi zake.
Au labda tofauti haijalishi ikiwa mwishowe tutasonga zaidi ya "sayansi ya data" na kukumbatia AI kama mwendelezo unaofuata wa kimantiki.
Kunihusu: Mkongwe wa IT wa miaka 25+ akichanganya data, AI, udhibiti wa hatari, mkakati na elimu. Mshindi wa 4x hackathon na athari za kijamii kutoka kwa wakili wa data. Hivi sasa inafanya kazi kuzindua wafanyikazi wa AI nchini Ufilipino. Jifunze zaidi kunihusu hapa: https://docligot.com