paint-brush
Šta će AI učiniti nauci o podacimaby@docligot
652 čitanja
652 čitanja

Šta će AI učiniti nauci o podacima

by Dominic Ligot5m2024/10/27
Read on Terminal Reader
Read this story w/o Javascript

Predugo; Citati

Razmišljajući o veoma manuelnoj i spornoj prirodi nauke o podacima i neizbežnom prelasku na veštačku inteligenciju
featured image - Šta će AI učiniti nauci o podacima
Dominic Ligot HackerNoon profile picture
0-item

Nedavno sam vodio čas o korištenju nauke o podacima za kibernetičku sigurnost, fokusirajući se na analizu podataka o hvatanju paketa – pomalo tehnička i tradicionalno suva tema. Pristup koji sam podijelio proizašao je iz mog iskustva u sajber sigurnosti unutar finansijskih institucija, pokrivajući ključne korake kao što su istraživačka analiza podataka, prethodna obrada i transformacija podataka dnevnika, te identificiranje anomalija kroz kombinaciju klasteriranja i analize mreže grafova.


Jedan iznenađujući aspekt bilo je vrijeme koje sam proveo pripremajući se za ovu sesiju – djelić onoga što bih inače uložio. AI je odigrao značajnu ulogu u pojednostavljivanju procesa. Koristio sam Claudea za pomoć u kodiranju, razvoju nacrta, pa čak i kreiranju slajdova. Ukupno, cijeli kurs je bio spreman u roku od 48 sati.


Sesija se pokazala zanimljivom. Učesnici, prvenstveno CISO-i koji obično ne kodiraju, smatrali su da su vježbe, napravljene uz pomoć AI, intuitivne i praktične. Moj cilj je bio da ih uronim u direktan rad sa podacima i kodom. Posebno su cijenili priliku da ručno istraže šta moderni nadzor kibernetičkih prijetnji i SIEM platforme obično automatiziraju, stječući uvid u procese koji se dešavaju "ispod haube".


Moj ključni zaključak iz klase bio je iznenađujuće kontraintuitivan: nauku o podacima, kakvu poznajemo, na kraju će zamijeniti AI . Ovo gledište može izgledati preuranjeno – ili možda ispred svog vremena – ali to je perspektiva koja opravdava raspravu.


Upozorenje: nešto od ovoga može pokrenuti ljude.

Seksičnost je prtljag

Više od decenije, nauka o podacima se slavi kao „najseksi posao 21. veka“. Ipak, kako AI brzo napreduje, postaje jasno da je teže previdjeti osnovne izazove u ovoj oblasti. Pojava moćne generativne AI bi vrlo lako mogla biti prekretnica za disciplinu koja je, gledajući unazad, možda bila labavije definirana i prenaglašena nego što se u početku priznavalo.


U svojoj suštini, nauka o podacima kombinuje informatiku, statistiku i poslovnu sposobnost, nudeći organizacijama obećanje praktičnih uvida iz ogromne količine podataka. Ovaj skup vještina je neosporno vrijedan u današnjem svijetu vođenom podacima. Međutim, ispod svog uglađenog imidža, polje se suočava sa značajnim problemima. Ono što se često označava kao znanost o podacima često se ispostavi da je splet labavo povezanih zadataka koji se ne usklađuju uvijek uredno, a mnogi profesionalci u ovoj oblasti bore se s punom širinom i složenošću koju disciplina zahtijeva.


Porast alata vođenih umjetnom inteligencijom, sposobnih za rukovanje analizom podataka, modeliranjem i generiranjem uvida, mogao bi nametnuti promjenu u načinu na koji gledamo na ulogu i budućnost same nauke o podacima. Kako AI nastavlja da pojednostavljuje i automatizuje mnoge od temeljnih zadataka u nauci o podacima, ovo polje se može suočiti sa obračunom o tome šta zaista znači biti naučnik podataka u doba inteligentne automatizacije.

The Cracks

Mnogi naučnici podataka, uprkos posedovanju sofisticiranih veština kodiranja i digitalnih alata, bave se radom koji je iznenađujuće ručan i podložan greškama . Priprema podataka, čišćenje i analiza uključuju zamorne, dugotrajne zadatke koji se ponavljaju i mehanički. U stvari, značajna količina rada u nauci o podacima ide u pripremu skupova podataka – zadatak koji često više liči na naporan rad nego na uzbudljivu nauku vođenu otkrićima za koju se predstavlja. Ovaj problem je otežan činjenicom da su mnogi koji ulaze na teren, u najboljem slučaju, amateri. Nakon što su prošli nekoliko online kurseva iz Pythona ili R-a, ovi "naučnici podataka" često nisu spremni za strogoću uloge . Nauka o podacima nije samo kodiranje. Uključuje duboku analizu, kontekstualno razumijevanje i sposobnost predstavljanja uvida netehničkoj publici. Istina, to je više istraživački posao, koji zahtijeva mješavinu kreativnosti i analitičkog razmišljanja koju mnogi na terenu jednostavno ne posjeduju.


Štaviše, mnogi naučnici podataka razvili su osjećaj da imaju pravo, očekujući visoke plate i unosne pakete samo na osnovu svoje titule. Ovakav stav odbija kompanije, posebno u sektorima u kojima je troškovna efikasnost najvažnija. Upoznao sam firme koje su nekada požurile da angažuju naučnike za podatke, ali sada preispituju. Zašto plaćati visoke plate nekome ko provodi većinu svog vremena boreći se sa čišćenjem podataka, kada AI to može učiniti brže, bolje i uz djelić cijene?

AI Who?

Kako sam lično iskusio pisanje predavanja, generativna AI je evoluirala u moćnu silu upravo u oblastima u kojima je nauka o podacima najslabija. Zadaci poput pripreme podataka, čišćenja, pa čak i osnovne kvalitativne analize – aktivnosti koje oduzimaju mnogo vremena naučnika podataka – sada se lako automatiziraju od strane AI sistema . Ono što je još gore (ili bolje, ovisno o tome gdje se nalazite) je da je AI brža, preciznija i manje sklona ljudskim greškama ili umoru.


Za mnoge naučnike, ovo može biti zastrašujuće. Na kraju krajeva, ovi zadaci predstavljaju najveći dio njihovog svakodnevnog rada. Čišćenje podataka, na primjer, je notorno dugotrajno i sklono greškama, ali AI sada to može postići s nekoliko klikova i gotovo savršenom preciznošću. Naučnici podataka često se žale na ove neuredne zadatke, ali oni su od suštinskog značaja za njihove uloge. Kako se AI sistemi poboljšavaju, potreba za ljudima da rade ove poslove opada. Nije iznenađenje da veliki dio glasnih kritika protiv AI dolazi od samih naučnika podataka . Vide natpise na zidu i strahuju za svoj posao.

The Pettiness

Da stvar bude gora za naučnike podataka, ovo polje nije postiglo značajan napredak posljednjih godina. Uprkos velikom porastu popularnosti, znanost o podacima i dalje je opterećena neefikasnošću, greškama i nedostatkom jasnoće o tome šta bi tačno trebalo da podrazumeva . Nekada se vjerovalo da će sofisticiraniji alati i bolja obuka razviti ovo polje, ali to se nije materijaliziralo u mjeri u kojoj se očekivalo. Nasuprot tome, AI se stalno poboljšava. Algoritmi mašinskog učenja, obrada prirodnog jezika i generativni modeli brzo se razvijaju, ostavljajući tradicionalnu nauku o podacima u prašini.


Opet, visoka očekivanja plata naučnika podataka otežavaju problem . Kompanije koje su nekada tolerisale neefikasnost sada shvataju da veštačka inteligencija može da zameni veliki deo napornog rada bez velike cene za ljudski rad. Kako AI postaje sve vještija u obavljanju ključnih zadataka kao što su analiza, predviđanje, pa čak i prezentacija, ručna priroda nauke o podacima postaje sve suvišnija. Mnoge kompanije će shvatiti da ono što je nekada zahtevalo tim naučnika za podatke sada može biti efikasnije rukovano alatima sa veštačkom inteligencijom.

The Shift

Realnost je da je nauka o podacima, kako je tradicionalno definisana, na ivici zastarelosti. S obzirom da generativna AI napreduje zapanjujućom brzinom, potražnja za naučnicima ljudskih podataka u njihovom trenutnom obliku vjerovatno će opasti . Ovo ne znači da ljudi nemaju nikakvu ulogu u donošenju odluka na osnovu podataka, ali klasična uloga „naučnika podataka“ uskoro bi mogla biti koncept prošlosti. Ono što je sada potrebno jesu profesionalci obučeni u saradnji sa AI, iskorištavanjem njenih sposobnosti dok se koncentrišu na strateško razmišljanje i rešavanje složenih problema na višem nivou.


AI nije kraj analitike, uvida ili donošenja odluka – ona predstavlja njihovu evoluciju . Sadašnja oblast nauke o podacima rizikuje da zastari ako se ne razvija u korak. AI već revolucionira industrije, a nauka o podacima se mora prilagoditi ili rizikuje da bude zahvaćena ovim valom. Na kraju, pitanje možda nije da li će AI eliminisati nauku o podacima, već da li je nauka o podacima ikada u potpunosti ispunila svoja obećanja.


Ili možda razlika nije ni bitna ako konačno odemo dalje od "nauke o podacima" i prihvatimo AI kao sljedeći logični napredak.



O meni: 25+ godina IT veteran koji kombinuje podatke, AI, upravljanje rizikom, strategiju i obrazovanje. 4x pobjednik hakatona i društveni uticaj zagovornika podataka. Trenutno radi na pokretanju AI radne snage na Filipinima. Saznajte više o meni ovdje: https://docligot.com