Recent, am susținut o clasă despre utilizarea științei datelor pentru securitatea cibernetică, concentrându-se pe analiza datelor de captare a pachetelor - un subiect oarecum tehnic și tradițional sec. Abordarea pe care am împărtășit-o s-a bazat pe experiența mea în securitatea cibernetică în cadrul instituțiilor financiare, acoperind pași de bază cum ar fi analiza exploratorie a datelor, preprocesarea și transformarea datelor de jurnal și identificarea anomaliilor printr-o combinație de clustering și analiză de rețea grafică.
Un aspect surprinzător a fost timpul petrecut pregătindu-mă pentru această sesiune – o fracțiune din ceea ce aș investi de obicei. AI a jucat un rol semnificativ în eficientizarea procesului. L-am folosit pe Claude pentru a ajuta la codificare, la dezvoltarea schiței și chiar la crearea diapozitivelor. În total, întregul curs a fost gata în 48 de ore.
Sesiunea s-a dovedit a fi captivantă. Participanții, în primul rând CISO care de obicei nu codifică, au considerat că exercițiile, create cu ajutorul AI, sunt intuitive și practice. Scopul meu a fost să-i scufund în lucrul direct cu date și cod. Ei au apreciat în special șansa de a explora manual ceea ce automatizează de obicei platformele moderne de supraveghere a amenințărilor cibernetice și SIEM, obținând informații despre procesele care au loc „sub capotă”.
Principala concluzie de la curs a fost surprinzător de contraintuitivă: știința datelor, așa cum o știm, va fi în cele din urmă înlocuită de AI . Această viziune poate părea prematură – sau poate înaintea timpului său – dar este o perspectivă care merită discuții.
Atenție: unele dintre acestea ar putea declanșa oamenii.
Timp de peste un deceniu, știința datelor a fost celebrată drept „cea mai sexy job din secolul 21”. Cu toate acestea, pe măsură ce AI avansează rapid, devine clar că provocările de bază ale domeniului sunt mai greu de trecut cu vederea. Apariția IA generativă puternică ar putea foarte bine să fie punctul de vârf pentru o disciplină care, în retrospectivă, ar fi fost mai puțin definită și supraevaluată decât se recunoștea inițial.
În esență, știința datelor combină informatica, statistica și perspicacitatea afacerilor, oferind organizațiilor promisiunea unor perspective acționabile din cantități mari de date. Acest set de abilități este incontestabil valoros în lumea actuală bazată pe date. Cu toate acestea, sub imaginea sa lustruită, domeniul se confruntă cu probleme semnificative. Ceea ce este adesea etichetat ca știința datelor se dovedește adesea a fi un mozaic de sarcini vag legate, care nu se aliniază întotdeauna perfect, iar mulți profesioniști din domeniu se luptă cu toată amploarea și complexitatea pe care o cere disciplina.
Creșterea instrumentelor bazate pe inteligență artificială capabile să gestioneze analiza datelor, modelarea și generarea de informații ar putea forța o schimbare în modul în care vedem rolul și viitorul științei datelor în sine. Pe măsură ce AI continuă să simplifice și să automatizeze multe dintre sarcinile fundamentale din știința datelor, domeniul s-ar putea confrunta cu o socoteală asupra a ceea ce înseamnă cu adevărat să fii un om de știință a datelor în era automatizării inteligente.
Mulți oameni de știință ai datelor, deși dețin abilități sofisticate de codare și instrumente digitale, se angajează într-o muncă surprinzător de manuală și predispusă la erori . Pregătirea, curățarea și analiza datelor implică sarcini obositoare, consumatoare de timp, care sunt repetitive și mecanice. De fapt, o cantitate semnificativă de muncă în domeniul științei datelor este dedicată pregătirii seturilor de date - o sarcină care adesea se simte mai mult ca o corvoadă decât știința captivantă, bazată pe descoperiri, care este considerată a fi. Această problemă este agravată de faptul că mulți dintre cei care intră pe teren sunt, în cel mai bun caz, amatori. După ce au urmat câteva cursuri online în Python sau R, acești „oameni de știință de date” sunt adesea nepregătiți pentru rigorile rolului . Știința datelor nu este doar codificare. Aceasta implică o analiză profundă, înțelegere contextuală și capacitatea de a prezenta perspective unui public non-tehnic. Într-adevăr, este mai mult o muncă de cercetare, care necesită un amestec de creativitate și gândire analitică pe care mulți din domeniu pur și simplu nu îl posedă.
În plus, mulți oameni de știință de date au dezvoltat un sentiment de drept, așteptându-se la salarii mari și pachete profitabile doar în virtutea titlului lor. Această atitudine dezactivează companiile, mai ales în sectoarele în care eficiența costurilor este primordială. Am întâlnit firme care s-au grăbit cândva să angajeze oameni de știință de date, dar acum se regăsesc. De ce să plătiți salarii mari cuiva care își petrece cea mai mare parte a timpului luptând cu curățarea datelor, când AI o poate face mai rapid, mai bine și cu o fracțiune din cost?
Pe măsură ce am experimentat personal scrierea cursului, IA generativă a evoluat într-o forță puternică chiar în domeniile în care știința datelor este cea mai slabă. Sarcini precum pregătirea datelor, curățarea și chiar analiza calitativă de bază – activități care consumă o mare parte din timpul unui cercetător de date – sunt acum ușor automatizate de sistemele AI . Ceea ce este mai rău (sau mai bine, în funcție de locul în care vă aflați) este că AI este mai rapidă, mai precisă și mai puțin predispusă la erori umane sau oboseală.
Pentru mulți cercetători de date, acest lucru poate fi terifiant. La urma urmei, aceste sarcini reprezintă cea mai mare parte a muncii lor de zi cu zi. Curățarea datelor, de exemplu, necesită mult timp și este predispusă la greșeli, dar acum AI o poate realiza cu câteva clicuri și cu o precizie aproape perfectă. Oamenii de știință de date se plâng adesea de aceste sarcini groaznice, dar ele sunt fundamentale pentru rolurile lor. Pe măsură ce sistemele AI se îmbunătățesc, nevoia oamenilor de a face aceste sarcini scade. Nu este surprinzător faptul că o mare parte din criticile vocale împotriva inteligenței artificiale provin de la înșiși oamenii de știință ai datelor . Ei văd scrisul de pe perete și se tem pentru locurile lor de muncă.
Pentru a înrăutăți lucrurile pentru oamenii de știință de date, domeniul nu a făcut progrese semnificative în ultimii ani. În ciuda creșterii fulgerătoare a popularității, știința datelor este încă afectată de ineficiențe, erori și lipsă de claritate cu privire la ceea ce ar trebui să implice . Se credea cândva că instrumentele mai sofisticate și o pregătire mai bună vor evolua domeniul, dar acest lucru nu s-a materializat în măsura așteptată. În schimb, AI s-a îmbunătățit constant. Algoritmii de învățare automată, procesarea limbajului natural și modelele generative evoluează rapid, lăsând știința tradițională a datelor în praf.
Din nou, așteptările mari de salariu ale cercetătorilor de date agravează problema . Companiile care ar fi putut tolera cândva ineficiențe realizează acum că AI poate înlocui o mare parte din munca groaznică fără prețul mare atașat muncii umane. Odată cu AI care devine mai abil în îndeplinirea sarcinilor cheie precum analiza, prognoza și chiar prezentarea, natura manuală a științei datelor devine din ce în ce mai redundantă. Multe companii își vor da seama că ceea ce obișnuia necesita o echipă de oameni de știință a datelor poate fi acum gestionat mai eficient de instrumente bazate pe inteligență artificială.
Realitatea este că știința datelor, așa cum este definită în mod tradițional, este în pragul învechirii. Odată cu IA generativă care avansează într-un ritm uimitor, cererea de oameni de știință în date umane în forma lor actuală va scădea probabil . Acest lucru nu înseamnă că oamenii nu au niciun rol în luarea deciziilor bazate pe date, dar rolul clasic de „scientist al datelor” poate fi în curând un concept al trecutului. Ceea ce este nevoie acum sunt profesioniști calificați în colaborarea cu AI, valorificând capacitățile acesteia, concentrându-se în același timp pe gândirea strategică și rezolvarea de probleme complexe la un nivel superior.
Inteligența artificială nu este sfârșitul analizelor, perspectivelor sau luării deciziilor, ci reprezintă evoluția acestora . Domeniul actual al științei datelor riscă să devină învechit dacă nu evoluează în pas. AI revoluționează deja industriile, iar știința datelor trebuie să se adapteze sau riscă să fie depășită de acest val. În cele din urmă, întrebarea poate să nu fie dacă AI va elimina știința datelor, ci dacă știința datelor și-a îndeplinit vreodată pe deplin promisiunile.
Sau poate că distincția nici măcar nu contează dacă în cele din urmă trecem dincolo de hype-ul „științei datelor” și îmbrățișăm AI ca următoarea progresie logică.
Despre mine: veteran IT de peste 25 de ani care combină date, AI, managementul riscurilor, strategie și educație. Câștigător de 4 ori a hackatonului și impact social de la avocatul datelor. În prezent, lucrează pentru a porni forța de muncă AI în Filipine. Aflați mai multe despre mine aici: https://docligot.com