Duela gutxi, zibersegurtasunerako datuen zientzia erabiltzeari buruzko klase bat egin nuen, paketeen harrapaketa datuen analisian zentratuta, gai tekniko samarra eta tradizionalki lehorra. Partekatu dudan planteamendua finantza-erakundeetako zibersegurtasunean dudan esperientziatik abiatu da, oinarrizko urratsak barne hartzen dituena, besteak beste, esplorazio-datuen analisia, aurreprozesatu eta erregistro-datuak eraldatzea eta anomaliak identifikatzea clustering-a eta grafikoen sarearen analisiaren konbinazioaren bidez.
Alderdi harrigarri bat saio honetarako prestatzen eman nuen denbora izan zen, normalean inbertitzen nuenaren zati bat. AIk zeregin garrantzitsua izan zuen prozesua arintzeko. Claude erabili nuen kodetzen laguntzeko, eskema garatzen eta baita diapositibak sortzen ere. Guztira, 48 orduko epean ikastaro osoa prest zegoen.
Saioa erakargarria izan zen. Parte-hartzaileek, normalean kodetzen ez duten CISOek batez ere, AIren laguntzarekin landutako ariketak intuitiboak eta praktikoak zirela ikusi zuten. Nire helburua datuekin eta kodearekin zuzenean lanean murgiltzea zen. Batez ere eskertu zuten zibermehatxuen zaintza modernoek eta SIEM plataformek normalean zer automatizatu ohi duten eskuz arakatzeko aukera, "kanpaiaren azpian" gertatzen diren prozesuei buruzko ikuspegia lortuz.
Klasetik atera nuen gakoa harrigarriki kontrakoa izan zen: datuen zientzia, ezagutzen dugun moduan, azkenean AI ordezkatuko du . Ikuspegi hau goiztiarra dirudi —edo beharbada garaiz aurreratua—, baina eztabaida merezi duen ikuspegia da.
Abisua: hauetako batzuek jendea eragin dezakete.
Hamarkada bat baino gehiagoz, datu-zientzia "21. mendeko lan sexiena" gisa ospatu da. Hala ere, AI azkar aurrera doan heinean, argi dago eremuaren azpiko erronkak zailagoak direla ahaztea. Sorkuntza AI indartsuaren etorrera oso ondo izan liteke diziplina baterako punta-puntua, atzera begira, hasieran onartzen zena baino modu baxuagoan definitu eta gehiegi landuago egon zitekeela.
Funtsean, datu-zientziek informatika, estatistikak eta negozio-giroa uztartzen dituzte, eta erakundeei datu-kopuru handietatik abiatuta informazio bideragarrien promesa eskaintzen die. Trebetasun-multzo hau ukaezina da baliotsua gaur egungo datuetan oinarritutako munduan. Hala ere, bere irudi leunduaren azpian, eremuak arazo nabarmenak ditu. Askotan datu-zientzia gisa etiketatu ohi dena, maiz, beti txukun bat egiten ez duten zereginen adabaki bat bihurtzen da, eta arloko profesional askok diziplinak eskatzen duen zabaltasun eta konplexutasun osoarekin borrokatzen dute.
Datuen analisia, modelizazioa eta ikuspegia sortzeko gai diren AI-k bultzatutako tresnen gorakadak datu-zientzien beraren papera eta etorkizuna nola ikusten ditugun aldaketa behartu dezake. AI datu-zientziaren oinarrizko ataza asko sinplifikatzen eta automatizatzen jarraitzen duen heinean, eremuak automatizazio adimendunaren garaian datu-zientzialari bat izateak benetan esan nahi duen kontuan izan dezake.
Datu-zientzialari askok, kodetze trebetasun sofistikatuak eta tresna digitalak erabili arren, harrigarriro eskuliburua eta akatsetarako joera duten lanak egiten dituzte. Datuak prestatzeak, garbitzeak eta azterketak lan neketsuak eta denbora asko eskatzen dituzte, errepikakorrak eta mekanikoak direnak. Izan ere, datu-zientzien lan-kopuru handi bat datu-multzoak prestatzera bideratzen da, askotan lan neketsua iruditzen zaion zientzia zirraragarria eta aurkikuntzak bultzatutakoa baino. Arazo horri gehitzen zaio zelaira sartzen diren asko, onenean, afizionatuak izateak. Python edo R-en lineako ikastaro batzuk egin ondoren, "datuen zientzialari" hauek askotan ez daude prestatuta eginkizunaren zorroztasunerako . Datuen zientzia ez da soilik kodetzea. Azterketa sakona, testuinguruaren ulermena eta ikusle teknikoak ez direnei ikuspegiak aurkezteko gaitasuna dakar. Egia esan, ikerketa-lan bat gehiago da, arloko askok ez duten sormena eta pentsamendu analitikoa nahastea eskatzen duena.
Gainera, datu-zientzilari askok eskubide-sentimendua garatu dute, soldata handiak eta irabazi-paketeak espero dituzte beren tituluagatik soilik. Jarrera hori enpresak itzaltzen ari da, batez ere kostu-eraginkortasuna funtsezkoa den sektoreetan. Garai batean datu-zientzilariak kontratatzera presaka ibili ziren baina orain birplanteatzen ari diren enpresak ezagutu ditut. Zergatik ordaindu soldata altua datuen garbiketarekin denbora gehiena borrokan pasatzen duen bati, AI azkarrago, hobeto eta kostuaren zati batean egin dezakeenean?
Klasea idazten pertsonalki bizi izan nuenez, Generative AI indar indartsu bihurtu da datu-zientzia ahulena den eremuetan. Datuak prestatzea, garbitzea eta oinarrizko analisi kualitatiboa bezalako zereginak (datu zientzialari baten denbora asko kontsumitzen duten jarduerak) orain erraz automatizatzen dituzte AI sistemek . Okerrena (edo hobea, zauden lekuaren arabera) da AI azkarragoa, zehatzagoa eta giza akatsak edo nekeak izateko joera gutxiago duela.
Datu-zientzialari askorentzat, hori beldurgarria izan daiteke. Azken finean, zeregin horiek eguneroko lanaren zati handiena adierazten dute. Datuen garbiketak, adibidez, denbora asko eskatzen du eta akatsak egiteko joera du, baina AI-ak orain klik gutxi batzuekin eta zehaztasun ia perfektuarekin lor dezake. Datu-zientzialariek sarritan kexatzen dira zeregin txukun horietaz, baina, hala ere, funtsezkoak dira beren eginkizunetarako. AI sistemak hobetzen diren heinean, gizakiek lan hauek egiteko beharra gutxitu egiten da. Ez da harritzekoa AIren aurkako ahots-kritikaren zati handi bat datu-zientzialariek eurek etortzea . Idatziak horman ikusten dituzte eta beldurra dute euren lanengatik.
Datu-zientzialariei gauzak okertzeko, arloak ez du aurrerapen handirik eman azken urteotan. Ospearen gorakada meteorikoa izan arren, datuen zientziak eraginkortasunik gabeak, akatsak eta zehatz-mehatz zer suposatu beharko lukeen argitasunik gabe jarraitzen du. Garai batean uste zen tresna sofistikatuagoek eta prestakuntza hobeagoek eremua eboluzionatuko zutela, baina hori ez da espero zen neurrian gauzatu. Aitzitik, AI etengabe hobetu da. Ikaskuntza automatikoko algoritmoak, hizkuntza naturalaren prozesamendua eta eredu sortzaileak azkar eboluzionatzen ari dira, datu-zientzia tradizionala hautsean utziz.
Berriz ere, datu-zientzialarien soldata itxaropen handiek arazoa areagotzen dute . Garai batean eraginkortasunik ezak jasan zitezkeen enpresak orain konturatzen ari dira AI-ak lan handia ordezka dezakeela gizakien lanari loturiko prezio handirik gabe. AI-a trebeagoa denez, analisiak, aurreikuspenak eta baita aurkezpenak bezalako funtsezko zereginak egiteko , datuen zientziaren eskuzko izaera gero eta erredundanteagoa da. Enpresa asko konturatuko dira lehen datu-zientzialari talde bat behar zena orain modu eraginkorragoan kudeatu daitekeela AI-k bultzatutako tresnek.
Errealitatea da datuen zientzia, tradizioz definitu bezala, zaharkitzearen atarian dagoela. Sorkuntzako IA erritmo harrigarrian aurrera eginda, giza datuen zientzialarien eskaerak behera egingo du ziurrenik . Horrek ez du esan nahi gizakiek datuetan oinarritutako erabakiak hartzeko zereginik ez dutenik, baina "datuen zientzialari" rol klasikoa iraganeko kontzeptua izan daiteke laster. Orain behar dena AI-rekin elkarlanean aritzeko trebeak diren profesionalak dira, bere gaitasunak aprobetxatuz, pentsamendu estrategikoan eta arazo konplexuetan maila altuago batean konpontzen diren bitartean.
AI ez da analisien, ikuspegien edo erabakiak hartzeko amaiera; haien bilakaera adierazten du . Datu-zientzien egungo eremuak zaharkituta geratzeko arriskua du pausoz eboluzionatzen ez badu. AI industriak iraultzen ari da dagoeneko, eta datuen zientziak egokitu egin behar du olatu honek gainditzeko edo gainditzeko arriskua. Azken finean, baliteke galdera ez izatea AI-ak datuen zientzia ezabatuko ote duen, baizik eta datuen zientziak bere promesak bete dituen ala ez.
Edo, beharbada, bereizketak ez du axola azkenean "datuen zientzia" iragarkitik haratago joan eta AI hurrengo progresio logiko gisa hartzen badugu.
Niri buruz: 25 urtetik gorako IT beteranoa datuak, AI, arriskuen kudeaketa, estrategia eta hezkuntza konbinatuz. 4x hackathonen irabazlea eta datuen defendatzailearen eragin soziala. Gaur egun, Filipinetako AIko langileria sustatzeko lanean. Lortu niri buruz gehiago hemen: https://docligot.com