Pidin äskettäin kurssin datatieteen käyttämisestä kyberturvallisuuteen keskittyen pakettikaappausdatan analysointiin – melko tekniseen ja perinteisesti kuivaan aiheeseen. Jakamani lähestymistapa perustui kokemukseni kyberturvallisuudesta rahoituslaitoksissa, ja se kattaa ydinvaiheet, kuten tutkivan data-analyysin, lokitietojen esikäsittelyn ja muuntamisen sekä poikkeamien tunnistamisen klusteroinnin ja graafisen verkkoanalyysin yhdistelmän avulla.
Yksi yllättävä näkökohta oli aika, jonka käytin valmistautumaan tähän istuntoon – murto-osa siitä, mitä tavallisesti investoin. Tekoälyllä oli merkittävä rooli prosessin virtaviivaistamisessa. Käytin Claudea apuna koodauksessa, ääriviivan kehittämisessä ja jopa diojen luomisessa. Kaiken kaikkiaan koko kurssi oli valmis 48 tunnissa.
Istunto osoittautui mukaansatempaavaksi. Osallistujat, pääasiassa CISO:t, jotka eivät yleensä koodaa, pitivät tekoälyn avulla laadittuja harjoituksia intuitiivisina ja käytännönläheisinä. Tavoitteeni oli upottaa heidät työskentelemään suoraan tietojen ja koodin kanssa. He arvostivat erityisesti mahdollisuutta tutkia manuaalisesti, mitä nykyaikaiset kyberuhkien valvonta- ja SIEM-alustat tyypillisesti automatisoivat, ja he saivat käsitystä "konepellin alla" tapahtuvista prosesseista.
Avainpalautukseni luokasta oli yllättävän ristiriitainen: tietotekniikka, sellaisena kuin me sen tunnemme, korvataan lopulta tekoälyllä . Tämä näkemys saattaa tuntua ennenaikaiselta – tai ehkä aikaansa edellä – mutta se on näkökulma, joka ansaitsee keskustelun.
Varoitus: osa tästä saattaa laukaista ihmisiä.
Tietotiedettä on yli vuosikymmenen ajan pidetty "2000-luvun seksikkäimpana työnä". Mutta kun tekoäly kehittyy nopeasti, on käymässä selväksi, että alan taustalla olevia haasteita on vaikeampi jättää huomiotta. Tehokkaan generatiivisen tekoälyn tulo voi hyvinkin olla käännekohta tieteenalalle, joka jälkikäteen katsottuna on saattanut olla löyhemmin määritelty ja ylihyväksytty kuin alun perin myönnettiin.
Datatieteessä yhdistyvät pohjimmiltaan tietojenkäsittelytiede, tilastot ja bisnestaito, mikä tarjoaa organisaatioille lupauksen toteuttaa oivalluksia valtavista tietomääristä. Tämä taitosarja on kiistatta arvokas nykypäivän datalähtöisessä maailmassa. Kiillotetun kuvan alla kenttä kohtaa kuitenkin merkittäviä ongelmia. Se, mitä usein kutsutaan datatieteeksi, osoittautuu usein löyhästi toisiinsa liittyvien tehtävien tilkkutäkkiksi, jotka eivät aina sovi yhteen, ja monet alan ammattilaiset kamppailevat tieteenalan vaatiman täyden laajuuden ja monimutkaisuuden kanssa.
Tietojen analysointiin, mallintamiseen ja näkemysten tuottamiseen pystyvien tekoälypohjaisten työkalujen nousu saattaa pakottaa näkemyksemme itse datatieteen roolista ja tulevaisuudesta. Koska tekoäly yksinkertaistaa ja automatisoi edelleen monia tietotieteen perustehtäviä, ala voi joutua miettimään, mitä datatieteilijä todella tarkoittaa älykkään automaation aikakaudella.
Monet datatieteilijät, vaikka heillä on kehittyneitä koodaustaitoja ja digitaalisia työkaluja, tekevät työtä, joka on yllättävän manuaalista ja virhealtista . Tietojen valmistelu, puhdistaminen ja analysointi sisältävät työläitä, aikaa vieviä tehtäviä, jotka ovat toistuvia ja mekaanisia. Itse asiassa tietojoukkojen valmisteluun kuluu huomattava määrä datatieteen työtä – tehtävä, joka usein tuntuu enemmän raa'alta kuin jännittävältä, löytövetoiselta tieteeltä, jonka se on esitetty. Tätä ongelmaa pahentaa se tosiasia, että monet kentälle tulevat ovat parhaimmillaan amatöörejä. Nämä "datatutkijat" ovat käyneet muutaman Python- tai R-verkkokurssin, joten he eivät useinkaan ole valmistautuneet roolin ankaruuteen . Datatiede ei ole vain koodausta. Siihen sisältyy syvällinen analyysi, kontekstuaalinen ymmärtäminen ja kyky esittää oivalluksia ei-tekniselle yleisölle. Itse asiassa se on enemmän tutkimustyötä, joka vaatii sekoitus luovuutta ja analyyttistä ajattelua, jota monilla alalla ei yksinkertaisesti ole.
Lisäksi monet datatieteilijät ovat kehittäneet oikeutensa tunteen, ja he odottavat korkeita palkkoja ja tuottoisia paketteja jo nimensä vuoksi. Tämä asenne syrjäyttää yritykset, erityisesti aloilla, joilla kustannustehokkuus on ensiarvoisen tärkeää. Olen tavannut yrityksiä, jotka kerran ryntäsivät palkkaamaan datatieteilijöitä, mutta harkitsevat nyt uudelleen. Miksi maksaa korkeita palkkoja henkilölle, joka käyttää suurimman osan ajastaan painikseen tietojen puhdistamisen kanssa, kun tekoäly voi tehdä sen nopeammin, paremmin ja murto-osalla kustannuksista?
Kuten olen henkilökohtaisesti kokenut kurssin kirjoittamisen, Generative AI on kehittynyt voimakkaaksi voimaksi juuri niillä alueilla, joilla datatiede on heikointa. Tekoälyjärjestelmät automatisoivat nyt helposti tehtävät, kuten tietojen valmistelu, puhdistaminen ja jopa perustavanlaatuinen laadullinen analyysi – toiminnot, jotka vievät suuren osan datatieteilijän ajasta. Pahinta (tai parempi, riippuen siitä, missä seisot) on, että tekoäly on nopeampi, tarkempi ja vähemmän altis inhimillisille virheille tai väsymykselle.
Monille datatieteilijöille tämä voi olla pelottavaa. Loppujen lopuksi nämä tehtävät muodostavat suurimman osan heidän päivittäisestä työstään. Esimerkiksi tietojen puhdistaminen on tunnetusti aikaa vievää ja virhealtista, mutta tekoäly voi nyt suorittaa sen muutamalla napsautuksella ja lähes täydellisellä tarkkuudella. Datatieteilijät valittavat usein näistä röyhkeätehtävistä, mutta ne ovat kuitenkin heidän roolinsa perustavanlaatuisia. Tekoälyjärjestelmien parantuessa ihmisten tarve tehdä näitä töitä vähenee. Ei ole yllättävää, että suuri osa tekoälyä vastaan kohdistuvasta äänekkäästä kritiikistä tulee datatutkijoilta itseltään . He näkevät kirjoituksen seinällä ja pelkäävät työnsä puolesta.
Tietojen tutkijoiden tilannetta pahentaa, että ala ei ole edistynyt merkittävästi viime vuosina. Huolimatta valtavasta suosion kasvusta datatiedettä vaivaavat edelleen tehottomuudet, virheet ja epäselvyys siitä, mitä sen pitäisi sisältää . Aikoinaan uskottiin, että kehittyneemmät työkalut ja parempi koulutus kehittäisivät alaa, mutta tämä ei ole toteutunut odotetusti. Sitä vastoin tekoäly on jatkuvasti parantunut. Koneoppimisalgoritmit, luonnollisen kielen käsittely ja generatiiviset mallit kehittyvät nopeasti ja jättävät perinteisen datatieteen pölyyn.
Taas kerran datatutkijoiden korkeat palkkaodotukset pahentavat ongelmaa . Yritykset, jotka ovat saattaneet sietää tehottomuuksia, ovat nyt ymmärtäneet, että tekoäly voi korvata suuren osan töykeästä työstä ilman ihmistyön tiukkaa hintalappua. Tekoälyn kehittyessä taitavammaksi keskeisten tehtävien, kuten analyysin, ennustamisen ja jopa esittämisen, suorittamisessa, datatieteen manuaalisesta luonteesta tulee yhä tarpeettomampaa. Monet yritykset ymmärtävät, että se, mikä aiemmin vaati datatieteilijöitä, voidaan nyt hoitaa tehokkaammin tekoälyllä toimivilla työkaluilla.
Tosiasia on, että datatiede, kuten perinteisesti määritellään, on vanhenemisen partaalla. Generatiivisen tekoälyn edistyessä hämmästyttävää vauhtia, ihmisten tietotieteilijöiden kysyntä nykyisessä muodossaan todennäköisesti vähenee . Tämä ei tarkoita, etteikö ihmisillä olisi roolia datalähtöisessä päätöksenteossa, mutta klassinen "datatutkijan" rooli saattaa pian olla menneisyyden käsite. Nyt tarvitaan ammattilaisia, jotka osaavat tehdä yhteistyötä tekoälyn kanssa, hyödyntää sen kykyjä ja keskittyä strategiseen ajatteluun ja monimutkaiseen ongelmanratkaisuun korkeammalla tasolla.
Tekoäly ei ole analytiikan, oivallusten tai päätöksenteon loppu – se edustaa niiden kehitystä . Nykyinen datatieteen ala on vaarassa vanhentua, jos se ei kehity askel askeleelta. Tekoäly mullistaa jo toimialoja, ja datatieteen on sopeuduttava, tai tämä aalto saattaa joutua ohittamaan. Viime kädessä kysymys ei ehkä ole siitä, poistaako tekoäly datatieteen, vaan siitä, onko datatiede koskaan täyttänyt lupauksensa.
Tai ehkä erolla ei ole edes väliä, jos siirrymme vihdoin "datatieteen" hypetyksen taakse ja otamme tekoälyn seuraavana loogisena edistyksenä.
Tietoja minusta: yli 25-vuotias IT-veteraani, joka yhdistää datan, tekoälyn, riskienhallinnan, strategian ja koulutuksen. 4x hackathonin voittaja ja sosiaalinen vaikutus datan puolestapuhujalta. Työskentelee parhaillaan tekoälytyövoiman käynnistämiseksi Filippiineillä. Lisätietoja minusta täällä: https://docligot.com