paint-brush
Hvad AI vil gøre for datavidenskabved@docligot
652 aflæsninger
652 aflæsninger

Hvad AI vil gøre for datavidenskab

ved Dominic Ligot5m2024/10/27
Read on Terminal Reader
Read this story w/o Javascript

For langt; At læse

Refleksion over datavidenskabens meget manuelle og omstridte natur og det uundgåelige skift til AI
featured image - Hvad AI vil gøre for datavidenskab
Dominic Ligot HackerNoon profile picture
0-item

Jeg holdt for nylig en klasse om brug af datavidenskab til cybersikkerhed, med fokus på analyse af pakkefangstdata - et noget teknisk og traditionelt tørt emne. Den tilgang, jeg delte, stammede fra min erfaring med cybersikkerhed inden for finansielle institutioner, og dækkede kernetrin som eksplorativ dataanalyse, forbehandling og transformation af logdata og identificering af anomalier gennem en kombination af klyngedannelse og grafisk netværksanalyse.


Et overraskende aspekt var den tid, jeg brugte på at forberede mig til denne session – en brøkdel af, hvad jeg normalt ville investere. AI spillede en væsentlig rolle i at strømline processen. Jeg brugte Claude til at hjælpe med kodning, udvikling af dispositionen og endda oprettelse af slides. I alt var hele banen klar inden for 48 timer.


Sessionen viste sig at være engagerende. Deltagerne, primært CISO'er, der typisk ikke koder, fandt øvelserne, der er lavet med AI's assistance, som intuitive og praktiske. Mit mål var at fordybe dem i at arbejde direkte med data og kode. De satte især pris på chancen for manuelt at udforske, hvad moderne cybertrusselsovervågning og SIEM-platforme typisk automatiserer, og få indsigt i de processer, der foregår "under motorhjelmen."


Min vigtigste takeaway fra klassen var overraskende kontraintuitiv: datavidenskab, som vi kender det, vil med tiden blive erstattet af AI . Dette synspunkt kan virke for tidligt – eller måske forud for sin tid – men det er et perspektiv, der berettiger til diskussion.


Advarsel: noget af dette kan udløse folk.

Sexiness er bagage

I over et årti er datavidenskab blevet fejret som det "sexede job i det 21. århundrede." Men efterhånden som kunstig intelligens udvikler sig hurtigt, bliver det klart, at feltets underliggende udfordringer er sværere at overse. Fremkomsten af kraftfuld generativ AI kunne meget vel være vendepunktet for en disciplin, der set i bakspejlet kan have været mere løst defineret og overhypet end oprindeligt anerkendt.


I sin essens kombinerer datavidenskab datalogi, statistik og forretningssans og giver organisationer løftet om handlingsdygtig indsigt fra enorme mængder data. Dette færdighedssæt er unægteligt værdifuldt i nutidens datadrevne verden. Men under sit polerede image står feltet over for betydelige problemer. Det, der ofte betegnes som datavidenskab, viser sig ofte at være et kludetæppe af løst relaterede opgaver, der ikke altid hænger pænt sammen, og mange fagfolk inden for området kæmper med den fulde bredde og kompleksitet, som disciplinen kræver.


Fremkomsten af AI-drevne værktøjer, der er i stand til at håndtere dataanalyse, modellering og generering af indsigt kan fremtvinge et skift i, hvordan vi ser på selve datavidenskabens rolle og fremtid. Efterhånden som AI fortsætter med at forenkle og automatisere mange af de grundlæggende opgaver inden for datavidenskab, kan feltet stå over for en regning på, hvad det virkelig vil sige at være dataforsker i en tidsalder med intelligent automatisering.

Revnerne

Mange datavidenskabsmænd, på trods af at de har sofistikerede kodningsfærdigheder og digitale værktøjer, engagerer sig i arbejde, der er overraskende manuelt og tilbøjeligt til fejl . Dataforberedelse, rensning og analyse involverer kedelige, tidskrævende opgaver, der er gentagne og mekaniske. Faktisk går en betydelig mængde datavidenskabsarbejde med at forberede datasæt - en opgave, der ofte føles mere som slid end den spændende, opdagelsesdrevne videnskab, den er fremstillet for at være. Dette problem forstærkes af det faktum, at mange, der går ind på banen, i bedste fald er amatører. Efter at have taget et par onlinekurser i Python eller R, er disse "dataforskere" ofte uforberedte på belastningen af rollen . Datavidenskab er ikke kun kodning. Det involverer dyb analyse, kontekstuel forståelse og evnen til at præsentere indsigt for ikke-tekniske målgrupper. I sandhed er det mere et forskningsjob, der kræver en blanding af kreativitet og analytisk tænkning, som mange i feltet simpelthen ikke besidder.


Desuden har mange dataforskere udviklet en følelse af berettigelse, og forventer høje lønninger og lukrative pakker i kraft af deres titel. Denne holdning afskrækker virksomheder, især i sektorer, hvor omkostningseffektivitet er altafgørende. Jeg har mødt firmaer, der engang skyndte sig at ansætte dataforskere, men som nu overvejer. Hvorfor betale høje lønninger til nogen, der bruger det meste af deres tid på at kæmpe med datarensning, når AI kan gøre det hurtigere, bedre og til en brøkdel af prisen?

AI Hvem?

Som jeg personligt oplevede at skrive klassen, har Generativ AI udviklet sig til en stærk kraft på netop de områder, hvor datavidenskab er svagest. Opgaver som dataforberedelse, rensning og endda grundlæggende kvalitativ analyse – aktiviteter, der optager meget af en dataforskers tid – er nu let automatiseret af AI-systemer . Hvad der er værre (eller bedre, afhængigt af hvor du står) er, at AI er hurtigere, mere præcis og mindre tilbøjelig til menneskelige fejl eller træthed.


For mange dataforskere kan dette være skræmmende. Disse opgaver repræsenterer trods alt hovedparten af deres daglige arbejde. Datarensning er for eksempel notorisk tidskrævende og udsat for fejl, men AI kan nu opnå det med et par klik og næsten perfekt præcision. Dataforskere klager ofte over disse grynteopgaver, men alligevel er de fundamentale for deres roller. Efterhånden som AI-systemer forbedres, svinder behovet for mennesker til at udføre disse jobs. Det er ingen overraskelse, at meget af den vokale kritik mod AI kommer fra dataforskere selv . De ser skriften på væggen og frygter for deres job.

Smaaligheden

For at gøre tingene værre for dataforskere har feltet ikke gjort væsentlige fremskridt i de seneste år. På trods af sin voldsomme stigning i popularitet er datavidenskab stadig plaget af ineffektivitet, fejl og en mangel på klarhed om, hvad det præcist skal indebære . Man troede engang, at mere sofistikerede værktøjer og bedre træning ville udvikle feltet, men dette er ikke blevet til i det forventede omfang. I modsætning hertil er AI støt forbedret. Maskinlæringsalgoritmer, naturlig sprogbehandling og generative modeller udvikler sig hurtigt og efterlader traditionel datavidenskab i støvet.


Igen forværrer de høje lønforventninger fra dataforskere problemet . Virksomheder, der måske engang kunne have tolereret ineffektivitet, indser nu, at kunstig intelligens kan erstatte meget af gryntearbejdet uden den voldsomme pris, der er knyttet til menneskelig arbejdskraft. Med AI bliver dygtigere til at udføre nøgleopgaver som analyse, prognoser og endda præsentation, bliver datavidenskabens manuelle natur mere og mere overflødig. Mange virksomheder vil indse, at det, der før krævede et team af dataforskere, nu kan håndteres mere effektivt af AI-drevne værktøjer.

Skiftet

Virkeligheden er, at datavidenskab, som traditionelt defineret, er på randen af forældelse. Med generativ kunstig intelligens, der udvikler sig med en forbløffende hastighed, vil efterspørgslen efter menneskelige dataforskere i deres nuværende form sandsynligvis falde . Dette betyder ikke, at mennesker ikke har nogen rolle i datadrevet beslutningstagning, men den klassiske "data scientist"-rolle kan snart være et begreb fra fortiden. Det, der er brug for nu, er fagfolk, der er dygtige til at samarbejde med AI, der udnytter dens evner, mens de koncentrerer sig om strategisk tænkning og kompleks problemløsning på et højere niveau.


AI er ikke enden på analyser, indsigt eller beslutningstagning – den repræsenterer deres udvikling . Det nuværende felt inden for datavidenskab risikerer at blive forældet, hvis det ikke udvikler sig i takt. AI revolutionerer allerede industrier, og datavidenskaben skal tilpasse sig eller risikere at blive overhalet af denne bølge. I sidste ende er spørgsmålet måske ikke, om AI vil eliminere datavidenskab, men om datavidenskab nogensinde fuldt ud indfriede sine løfter.


Eller måske er forskellen lige meget, hvis vi endelig bevæger os ud over "data science"-hypen og omfavner AI som den næste logiske progression.



Om mig: 25+-årig IT-veteran, der kombinerer data, AI, risikostyring, strategi og uddannelse. 4x hackathon-vinder og social påvirkning fra dataadvokat. Arbejder i øjeblikket på at sætte gang i AI-arbejdsstyrken i Filippinerne. Lær mere om mig her: https://docligot.com