Nedavno sam održao predavanje o korištenju znanosti o podacima za kibernetičku sigurnost, fokusirajući se na analizu podataka o hvatanju paketa — pomalo tehnička i tradicionalno suhoparna tema. Pristup koji sam podijelio proizašao je iz mog iskustva u kibernetičkoj sigurnosti unutar financijskih institucija, pokrivajući temeljne korake kao što su istraživačka analiza podataka, pretprocesiranje i transformacija podataka dnevnika te identificiranje anomalija kombinacijom klasteriranja i mrežne analize grafikona.
Jedan iznenađujući aspekt bilo je vrijeme koje sam proveo pripremajući se za ovu sesiju - djelić onoga što bih obično uložio. AI je odigrao značajnu ulogu u pojednostavljenju procesa. Koristio sam Claudea da mi pomogne s kodiranjem, razvojem nacrta, pa čak i stvaranjem slajdova. Ukupno je cijeli tečaj bio spreman u roku od 48 sati.
Sesija se pokazala zanimljivom. Sudionici, prvenstveno CISO koji obično ne kodiraju, smatrali su da su vježbe, izrađene uz pomoć umjetne inteligencije, intuitivne i praktične. Moj je cilj bio uroniti ih u izravan rad s podacima i kodom. Posebno su cijenili priliku da ručno istraže što moderni nadzor kibernetičkih prijetnji i SIEM platforme obično automatiziraju, stječući uvid u procese koji se odvijaju "ispod haube".
Moj ključni zaključak sa predavanja bio je iznenađujuće kontraintuitivan: znanost o podacima, kakvu poznajemo, s vremenom će biti zamijenjena umjetnom inteligencijom . Ovo se stajalište može činiti preuranjenim - ili možda ispred svog vremena - ali to je gledište koje zaslužuje raspravu.
Upozorenje: nešto od ovoga moglo bi pokrenuti ljude.
Već više od desetljeća znanost o podacima slavi se kao "najseksi posao 21. stoljeća". Ipak, kako umjetna inteligencija brzo napreduje, postaje jasno da je izazove koji leže u polju teže previdjeti. Pojava moćne generativne umjetne inteligencije mogla bi biti prekretnica za disciplinu koja je, retrospektivno, možda bila labavije definirana i pretjerano hvaljena nego što se isprva priznavalo.
U svojoj suštini, znanost o podacima kombinira informatiku, statistiku i poslovnu oštroumnost, nudeći organizacijama obećanje korisnih uvida iz golemih količina podataka. Ovaj je skup vještina neosporno vrijedan u današnjem svijetu koji se temelji na podacima. Međutim, ispod svoje uglađene slike, polje se suočava sa značajnim problemima. Ono što se često označava kao znanost o podacima često se pokaže kao šarenilo labavo povezanih zadataka koji nisu uvijek uredno usklađeni, a mnogi profesionalci u tom području bore se s punom širinom i složenošću koju ta disciplina zahtijeva.
Uspon alata vođenih umjetnom inteligencijom koji mogu upravljati analizom podataka, modeliranjem i stvaranjem uvida mogao bi izazvati promjenu u načinu na koji gledamo na ulogu i budućnost same podatkovne znanosti. Kako umjetna inteligencija nastavlja pojednostavljivati i automatizirati mnoge od temeljnih zadataka unutar znanosti o podacima, polje bi se moglo suočiti s pitanjem što doista znači biti podatkovni znanstvenik u doba inteligentne automatizacije.
Mnogi znanstvenici koji se bave podacima, unatoč tome što posjeduju sofisticirane vještine kodiranja i digitalne alate, bave se radom koji je iznenađujuće ručan i sklon pogreškama . Priprema podataka, čišćenje i analiza uključuju zamorne, dugotrajne zadatke koji se ponavljaju i mehanički. Zapravo, značajna količina rada u znanosti o podacima odlazi na pripremu skupova podataka - zadatak koji se često više čini kao mukotrpan nego kao uzbudljiva znanost vođena otkrićima kakvom se predstavlja. Ovaj problem je složeniji činjenicom da su mnogi koji ulaze na teren u najboljem slučaju amateri. Nakon što su pohađali nekoliko online tečajeva u Pythonu ili R-u, ovi "znanstvenici podataka" često nisu spremni za težinu uloge . Znanost o podacima nije samo kodiranje. Uključuje duboku analizu, kontekstualno razumijevanje i sposobnost predstavljanja uvida netehničkoj publici. Zapravo, to je više istraživački posao, koji zahtijeva spoj kreativnosti i analitičkog razmišljanja koji mnogi u tom području jednostavno ne posjeduju.
Nadalje, mnogi podatkovni znanstvenici razvili su osjećaj da imaju pravo, očekujući visoke plaće i unosne pakete samo na temelju svoje titule. Ovakav stav odbija tvrtke, posebno u sektorima u kojima je troškovna učinkovitost najvažnija. Susreo sam tvrtke koje su jednom požurile zaposliti znanstvenike za podatke, ali sada ponovno razmišljaju. Zašto plaćati visoke plaće nekome tko provodi većinu svog vremena hrvajući se s čišćenjem podataka, kada AI to može učiniti brže, bolje i uz djelić cijene?
Dok sam osobno iskusio pisanje predavanja, Generative AI je evoluirao u moćnu silu upravo u područjima gdje je znanost o podacima najslabija. Zadaci poput pripreme podataka, čišćenja, pa čak i osnovne kvalitativne analize - aktivnosti koje oduzimaju mnogo vremena podatkovnog znanstvenika - sada se lako automatiziraju pomoću AI sustava . Ono što je još gore (ili bolje, ovisno o tome gdje se nalazite) je to što je umjetna inteligencija brža, preciznija i manje sklona ljudskoj pogrešci ili zamoru.
Za mnoge znanstvenike podataka to može biti zastrašujuće. Uostalom, ti zadaci predstavljaju glavninu njihovog svakodnevnog posla. Čišćenje podataka, na primjer, notorno je dugotrajno i podložno pogreškama, ali AI to sada može postići s nekoliko klikova i gotovo savršenom preciznošću. Znanstvenici koji se bave podacima često se žale na te grube zadatke, no oni su ključni za njihove uloge. Kako se sustavi umjetne inteligencije poboljšavaju, potreba za ljudima za obavljanje ovih poslova se smanjuje. Nije iznenađenje da velik dio glasnih kritika protiv umjetne inteligencije dolazi od samih podatkovnih znanstvenika . Vide natpise na zidu i boje se za svoja radna mjesta.
Da stvar bude još gora za znanstvenike koji se bave podacima, polje nije postiglo značajniji napredak posljednjih godina. Unatoč meteorskom porastu popularnosti, znanost o podacima još uvijek je mučena neučinkovitošću, pogreškama i nedostatkom jasnoće o tome što bi točno trebala uključivati . Nekada se vjerovalo da će sofisticiraniji alati i bolja obuka razviti ovo područje, ali to se nije ostvarilo u očekivanoj mjeri. Nasuprot tome, AI se stalno poboljšavao. Algoritmi strojnog učenja, obrada prirodnog jezika i generativni modeli brzo se razvijaju, ostavljajući tradicionalnu znanost o podacima u prašini.
Opet, visoke plaće koje očekuju podatkovni znanstvenici otežavaju problem . Tvrtke koje su nekoć možda tolerirale neučinkovitost sada shvaćaju da umjetna inteligencija može zamijeniti mnogo teškog rada bez velike cijene vezane za ljudski rad. Kako umjetna inteligencija postaje vještija u obavljanju ključnih zadataka poput analize, predviđanja, pa čak i prezentacije, ručna priroda znanosti o podacima postaje sve suvišnija. Mnoge će tvrtke shvatiti da se ono što je prije zahtijevalo tim znanstvenika za podatke sada može učinkovitije riješiti pomoću alata koji pokreću AI.
Stvarnost je da je znanost o podacima, kako je tradicionalno definirana, na rubu zastarjelosti. Uz napredovanje generativne umjetne inteligencije zapanjujućom brzinom, potražnja za ljudskim znanstvenicima podataka u njihovom sadašnjem obliku vjerojatno će opadati . To ne znači da ljudi nemaju nikakvu ulogu u donošenju odluka koje se temelje na podacima, ali bi klasična uloga "znanstvenika za podatke" uskoro mogla postati koncept prošlosti. Ono što je sada potrebno jesu profesionalci vješti u suradnji s umjetnom inteligencijom, iskorištavanjem njezinih mogućnosti dok se koncentriraju na strateško razmišljanje i rješavanje složenih problema na višoj razini.
AI nije kraj analitike, uvida ili donošenja odluka – on predstavlja njihovu evoluciju . Trenutačno područje znanosti o podacima riskira da postane zastarjelo ako se ne bude razvijalo u korak. AI već revolucionira industrije, a znanost o podacima mora se prilagoditi ili riskira da je zahvati ovaj val. U konačnici, pitanje možda nije hoće li umjetna inteligencija eliminirati podatkovnu znanost, već hoće li podatkovna znanost ikada u potpunosti ispuniti svoja obećanja.
Ili možda razlika uopće nije bitna ako se konačno pomaknemo dalje od pompe o “znanosti podataka” i prihvatimo AI kao sljedeći logični napredak.
O meni: 25+ godišnji IT veteran koji kombinira podatke, AI, upravljanje rizicima, strategiju i obrazovanje. 4x pobjednik hackathona i društveni utjecaj zagovornika podataka. Trenutno radi na pokretanju AI radne snage na Filipinima. Saznajte više o meni ovdje: https://docligot.com