Neseniai vedžiau paskaitą apie duomenų mokslo panaudojimą kibernetiniam saugumui, daugiausia dėmesio skirdama paketų fiksavimo duomenų analizei – šiek tiek techninei ir tradiciškai sausa tema. Metodas, kuriuo dalinausi, rėmėsi mano patirtimi kibernetinio saugumo srityje finansų institucijose, apimantį pagrindinius veiksmus, tokius kaip tiriamoji duomenų analizė, išankstinis žurnalų duomenų apdorojimas ir transformavimas bei anomalijų nustatymas derinant grupavimo ir grafikų tinklo analizę.
Vienas stebinantis aspektas buvo laikas, kurį praleidau ruošdamasis šiai sesijai – tai dalis to, ką paprastai investavau. AI suvaidino svarbų vaidmenį supaprastinant procesą. Naudojau Claude'ą, kad padėtų koduoti, kurti kontūrą ir net kurti skaidres. Iš viso visas kursas buvo paruoštas per 48 valandas.
Sesija pasirodė įdomi. Dalyviai, pirmiausia CISO, kurie paprastai nekoduoja, manė, kad pratimai, sukurti padedant AI, yra intuityvūs ir praktiški. Mano tikslas buvo panardinti juos į tiesioginį darbą su duomenimis ir kodu. Jie ypač įvertino galimybę rankiniu būdu ištirti, ką šiuolaikinės kibernetinės grėsmės stebėjimas ir SIEM platformos paprastai automatizuoja, taip įgydami įžvalgų apie procesus, vykstančius „po gaubtu“.
Mano pagrindinė pamoka buvo stebėtinai priešinga: duomenų mokslą, kaip mes žinome, galiausiai pakeis AI . Toks požiūris gali atrodyti per anksti arba galbūt pralenkė savo laiką, tačiau tai yra perspektyva, dėl kurios verta diskutuoti.
Įspėjimas: kai kurie iš jų gali sujaudinti žmones.
Daugiau nei dešimtmetį duomenų mokslas buvo švenčiamas kaip „seksualiausias XXI amžiaus darbas“. Tačiau sparčiai tobulėjant dirbtiniam intelektui tampa aišku, kad sunku nepastebėti pagrindinių šios srities iššūkių. Galingo generatyvaus dirbtinio intelekto atsiradimas gali būti lūžio taškas disciplinai, kuri, žvelgiant atgal, galėjo būti laisviau apibrėžta ir perdėta, nei buvo pripažinta iš pradžių.
Iš esmės duomenų mokslas sujungia kompiuterių mokslą, statistiką ir verslo sumanumą, organizacijoms žadėdamas įgyvendinti įžvalgas iš didžiulio duomenų kiekio. Šis įgūdžių rinkinys neabejotinai vertingas šiuolaikiniame duomenimis pagrįstame pasaulyje. Tačiau po savo nugludintu įvaizdžiu laukas susiduria su reikšmingomis problemomis. Tai, kas dažnai įvardijama kaip duomenų mokslas, dažnai pasirodo esąs laisvai susijusių užduočių kratinys, kuris ne visada tvarkingai sutampa, o daugelis šios srities profesionalų kovoja su visa apimtimi ir sudėtingumu, kurio reikalauja disciplina.
AI pagrįstų įrankių, galinčių tvarkyti duomenų analizę, modeliavimą ir įžvalgų generavimą, atsiradimas gali priversti pakeisti požiūrį į paties duomenų mokslo vaidmenį ir ateitį. Kadangi dirbtinis intelektas ir toliau supaprastina ir automatizuoja daugelį pagrindinių duomenų mokslo užduočių, šioje srityje gali tekti svarstyti, ką iš tikrųjų reiškia būti duomenų mokslininku intelektualaus automatizavimo amžiuje.
Daugelis duomenų mokslininkų, nepaisant sudėtingų kodavimo įgūdžių ir skaitmeninių įrankių, atlieka darbą, kuris yra stebėtinai rankinis ir yra linkęs į klaidas . Duomenų paruošimas, valymas ir analizė apima varginančius, daug laiko reikalaujančius darbus, kurie yra pasikartojantys ir mechaniški. Tiesą sakant, daug duomenų mokslo darbo įdedama ruošiant duomenų rinkinius – tai užduotis, kuri dažnai atrodo kaip veržlumas, o ne jaudinantis, atradimais pagrįstas mokslas, kuriuo ji yra sukurta. Šią problemą apsunkina tai, kad daugelis įžengusių į lauką geriausiu atveju yra mėgėjai. Išklausę keletą internetinių Python arba R kursų, šie „duomenų mokslininkai“ dažnai nėra pasirengę griežtam vaidmeniui . Duomenų mokslas nėra tik kodavimas. Tai apima gilią analizę, konteksto supratimą ir galimybę pateikti įžvalgas netechninei auditorijai. Tiesą sakant, tai labiau mokslinis darbas, reikalaujantis kūrybiškumo ir analitinio mąstymo derinio, kurio daugelis šioje srityje tiesiog neturi.
Be to, daugelis duomenų mokslininkų išsiugdė teisių jausmą, tik dėl savo titulo tikisi didelių atlyginimų ir pelningų paketų . Toks požiūris išstumia įmones, ypač tuose sektoriuose, kuriuose svarbiausias yra išlaidų efektyvumas. Esu sutikęs firmų, kurios kažkada suskubo samdyti duomenų mokslininkus, bet dabar persvarsto. Kam mokėti didelius atlyginimus žmogui, kuris didžiąją laiko dalį praleidžia kovodamas su duomenų valymu, kai dirbtinis intelektas gali tai padaryti greičiau, geriau ir už nedidelę kainą?
Kaip aš asmeniškai patyriau rašydama kursą, „Generative AI“ tapo galinga jėga tose srityse, kuriose duomenų mokslas yra silpniausias. Tokias užduotis kaip duomenų paruošimas, valymas ir net pagrindinė kokybinė analizė – veikla, kuriai reikia daug duomenų mokslininko laiko – dabar AI sistemos lengvai automatizuoja . Blogiausia (arba geriau, priklausomai nuo to, kur stovite) tai, kad dirbtinis intelektas yra greitesnis, tikslesnis ir mažiau linkęs į žmogaus klaidas ar nuovargį.
Daugeliui duomenų mokslininkų tai gali būti baisu. Galų gale, šios užduotys sudaro didžiąją jų kasdienio darbo dalį. Pavyzdžiui, duomenų valymas užima daug laiko ir dažnai daro klaidas, tačiau dabar dirbtinis intelektas tai gali atlikti keliais paspaudimais ir beveik tobulu tikslumu. Duomenų mokslininkai dažnai skundžiasi dėl šių niūrių užduočių, tačiau jos yra esminės jų vaidmenims. Tobulėjant AI sistemoms, žmonių poreikis atlikti šiuos darbus mažėja. Nenuostabu, kad didžiąją dalį AI kritikuoja patys duomenų mokslininkai . Jie mato raštą ant sienos ir bijo dėl savo darbo.
Dar blogiau duomenų mokslininkams, kad pastaraisiais metais ši sritis nepadarė didelės pažangos. Nepaisant didžiulio populiarumo augimo, duomenų mokslą vis dar kamuoja neveiksmingumas, klaidos ir aiškumo stoka, ką tiksliai tai turėtų apimti . Kažkada buvo manoma, kad šioje srityje bus tobulinami įmantresni įrankiai ir geresnis mokymas, tačiau tai nepasitvirtino taip, kaip tikėtasi. Priešingai, AI nuolat tobulėjo. Mašininio mokymosi algoritmai, natūralios kalbos apdorojimas ir generaciniai modeliai sparčiai tobulėja, todėl tradicinis duomenų mokslas lieka dulkėse.
Vėlgi, šią problemą apsunkina dideli duomenų mokslininkų atlyginimo lūkesčiai. Įmonės, kurios kažkada toleravo neefektyvumą, dabar supranta, kad dirbtinis intelektas gali pakeisti daug niūrių darbų be didelių kainų, pririštų prie žmogaus darbo. Dirbtinis intelektas vis labiau įgudęs atlikti tokias pagrindines užduotis kaip analizė, prognozavimas ir net pateikimas, rankinis duomenų mokslo pobūdis tampa vis nereikalingesnis. Daugelis įmonių supras, kad tai, kam anksčiau reikėjo duomenų mokslininkų komandos, dabar gali būti veiksmingiau tvarkoma naudojant dirbtinio intelekto įrankius.
Realybė tokia, kad duomenų mokslas, kaip tradiciškai apibrėžta, yra ant pasenimo slenksčio. Stulbinančiu greičiu tobulėjant generatyviniam AI, dabartinio žmogaus duomenų mokslininkų poreikis greičiausiai sumažės . Tai nereiškia, kad žmonės neturi jokio vaidmens priimant duomenis pagrįstus sprendimus, tačiau klasikinis „duomenų mokslininko“ vaidmuo netrukus gali tapti praeities samprata. Dabar reikalingi profesionalai, gebantys bendradarbiauti su dirbtiniu intelektu, išnaudoti jo galimybes ir sutelkti dėmesį į strateginį mąstymą ir sudėtingų problemų sprendimą aukštesniu lygiu.
AI nėra analizės, įžvalgų ar sprendimų priėmimo pabaiga – tai atspindi jų raidą . Dabartinė duomenų mokslo sritis gali pasenti, jei ji nesikeis nuosekliai. AI jau daro revoliuciją pramonės šakose, todėl duomenų mokslas turi prisitaikyti arba rizikuoti, kad ši banga jį aplenks. Galiausiai gali kilti ne klausimas, ar AI panaikins duomenų mokslą, bet ar duomenų mokslas kada nors visiškai ištesėjo savo pažadus.
Arba galbūt skirtumas net nesvarbu, jei pagaliau pereisime už „duomenų mokslo“ ažiotažas ir priimsime AI kaip kitą logišką pažangą.
Apie mane: 25+ metų IT veteranas, derinantis duomenis, dirbtinį intelektą, rizikos valdymą, strategiją ir išsilavinimą. 4x hakatono nugalėtojas ir socialinis duomenų gynėjo poveikis. Šiuo metu dirbama siekiant paskatinti dirbtinio intelekto darbuotojus Filipinuose. Sužinokite daugiau apie mane čia: https://docligot.com