Ik heb onlangs een cursus gegeven over het gebruik van data science voor cybersecurity, met de focus op de analyse van packet capture data, een nogal technisch en traditioneel droog onderwerp. De aanpak die ik deelde, was gebaseerd op mijn ervaring in cybersecurity binnen financiële instellingen, en omvatte kernstappen zoals exploratieve data-analyse, preprocessing en transformatie van logdata en het identificeren van anomalieën door een combinatie van clustering en graph network analysis.
Een verrassend aspect was de tijd die ik besteedde aan de voorbereiding van deze sessie, een fractie van wat ik normaal zou investeren. AI speelde een belangrijke rol in het stroomlijnen van het proces. Ik gebruikte Claude om te helpen met coderen, het ontwikkelen van de outline en zelfs het maken van de slides. In totaal was de hele cursus binnen 48 uur klaar.
De sessie bleek boeiend. De deelnemers, voornamelijk CISO's die doorgaans niet coderen, vonden de oefeningen, die met behulp van AI waren gemaakt, intuïtief en praktisch. Mijn doel was om ze onder te dompelen in het direct werken met data en code. Ze waardeerden vooral de kans om handmatig te onderzoeken wat moderne cyberdreigingsbewaking en SIEM-platforms doorgaans automatiseren, en zo inzicht te krijgen in de processen die 'onder de motorkap' plaatsvinden.
Mijn belangrijkste conclusie uit de klas was verrassend contra-intuïtief: data science, zoals we die kennen, zal uiteindelijk worden vervangen door AI . Deze visie lijkt misschien voorbarig—of misschien zijn tijd ver vooruit—maar het is een perspectief dat discussie rechtvaardigt.
Waarschuwing: sommige van deze berichten kunnen triggerend zijn.
Al meer dan een decennium wordt datawetenschap gevierd als de "meest sexy baan van de 21e eeuw". Maar nu AI snel vordert, wordt het steeds duidelijker dat de onderliggende uitdagingen van het vakgebied moeilijker te negeren zijn. De komst van krachtige generatieve AI zou wel eens het omslagpunt kunnen zijn voor een vakgebied dat achteraf gezien misschien losser gedefinieerd en overhyped was dan aanvankelijk werd erkend.
In essentie combineert datawetenschap computerwetenschap, statistiek en zakelijk inzicht, en biedt het organisaties de belofte van bruikbare inzichten uit enorme hoeveelheden data. Deze vaardigheden zijn onmiskenbaar waardevol in de huidige datagedreven wereld. Maar onder het gepolijste imago kampt het vakgebied met aanzienlijke problemen. Wat vaak wordt gelabeld als datawetenschap, blijkt vaak een lappendeken van losjes gerelateerde taken te zijn die niet altijd netjes op elkaar aansluiten, en veel professionals in het vakgebied worstelen met de volledige breedte en complexiteit die de discipline vereist.
De opkomst van AI-gestuurde tools die data-analyse, modellering en het genereren van inzichten aankunnen, zou een verschuiving kunnen forceren in hoe we de rol en toekomst van data science zelf zien. Terwijl AI veel van de fundamentele taken binnen data science blijft vereenvoudigen en automatiseren, kan het vakgebied geconfronteerd worden met een afrekening over wat het werkelijk betekent om een datawetenschapper te zijn in het tijdperk van intelligente automatisering.
Veel datawetenschappers, ondanks hun geavanceerde programmeervaardigheden en digitale tools, houden zich bezig met werk dat verrassend handmatig en foutgevoelig is. Gegevensvoorbereiding, -reiniging en -analyse omvatten saaie, tijdrovende taken die repetitief en mechanisch zijn. In feite gaat er een aanzienlijk deel van de arbeid van datawetenschappers zitten in het voorbereiden van datasets, een taak die vaak meer aanvoelt als een sleur dan als de opwindende, ontdekkinggedreven wetenschap die het lijkt te zijn. Dit probleem wordt verergerd door het feit dat veel mensen die het veld betreden, op zijn best amateurs zijn. Na een paar online cursussen in Python of R te hebben gevolgd, zijn deze "datawetenschappers" vaak niet voorbereid op de strengheid van de rol . Datawetenschap is niet alleen coderen. Het omvat diepgaande analyse, contextueel begrip en het vermogen om inzichten te presenteren aan niet-technische doelgroepen. In werkelijkheid is het meer een onderzoeksbaan, waarvoor een mix van creativiteit en analytisch denken nodig is die velen in het veld gewoonweg niet bezitten.
Bovendien hebben veel datawetenschappers een gevoel van recht ontwikkeld, waarbij ze hoge salarissen en lucratieve pakketten verwachten, alleen al vanwege hun titel. Deze houding schrikt bedrijven af, vooral in sectoren waar kostenefficiëntie van het grootste belang is. Ik heb bedrijven ontmoet die ooit snel datawetenschappers inhuurden, maar die dat nu heroverwegen. Waarom zou je iemand die het grootste deel van zijn tijd worstelt met data cleaning, een hoog salaris betalen, terwijl AI het sneller, beter en voor een fractie van de kosten kan?
Zoals ik zelf heb ervaren tijdens het schrijven van de cursus, is Generative AI uitgegroeid tot een krachtige kracht op de gebieden waar data science het zwakst is. Taken zoals datavoorbereiding, opschoning en zelfs basis kwalitatieve analyse - activiteiten die veel tijd van een datawetenschapper in beslag nemen - worden nu eenvoudig geautomatiseerd door AI-systemen . Wat erger is (of beter, afhankelijk van waar je staat) is dat AI sneller, nauwkeuriger en minder vatbaar is voor menselijke fouten of vermoeidheid.
Voor veel datawetenschappers kan dit beangstigend zijn. Deze taken vormen immers het grootste deel van hun dagelijkse werk. Het opschonen van gegevens is bijvoorbeeld notoir tijdrovend en foutgevoelig, maar AI kan het nu met een paar klikken en bijna perfecte precisie uitvoeren. Datawetenschappers klagen vaak over deze zware taken, maar ze zijn fundamenteel voor hun rol. Naarmate AI-systemen verbeteren, neemt de behoefte aan mensen om deze taken uit te voeren af. Het is geen verrassing dat veel van de luide kritiek op AI afkomstig is van datawetenschappers zelf . Ze zien het handschrift aan de muur en vrezen voor hun baan.
Om het nog erger te maken voor datawetenschappers, heeft het vakgebied de afgelopen jaren geen significante vooruitgang geboekt. Ondanks de enorme populariteit wordt datawetenschap nog steeds geplaagd door inefficiënties, fouten en een gebrek aan duidelijkheid over wat het precies zou moeten inhouden . Er werd ooit gedacht dat geavanceerdere tools en betere training het vakgebied zouden laten evolueren, maar dit is niet in de mate uitgekomen die werd verwacht. Daarentegen is AI gestaag verbeterd. Machine learning-algoritmen, natuurlijke taalverwerking en generatieve modellen evolueren snel, waardoor traditionele datawetenschap in het stof bijt.
Opnieuw verergeren de hoge salarisverwachtingen van datawetenschappers het probleem . Bedrijven die ooit inefficiënties tolereerden, realiseren zich nu dat AI veel van het zware werk kan vervangen zonder het hoge prijskaartje dat aan menselijke arbeid hangt. Nu AI steeds beter wordt in het uitvoeren van belangrijke taken zoals analyse, prognose en zelfs presentatie, wordt de handmatige aard van datawetenschap steeds overbodiger. Veel bedrijven zullen zich realiseren dat wat vroeger een team van datawetenschappers vereiste, nu efficiënter kan worden afgehandeld door AI-aangedreven tools.
De realiteit is dat data science, zoals traditioneel gedefinieerd, op het randje van veroudering staat. Nu generatieve AI zich met een verbazingwekkende snelheid ontwikkelt, zal de vraag naar menselijke datawetenschappers in hun huidige vorm waarschijnlijk afnemen . Dit betekent niet dat mensen geen rol spelen in datagestuurde besluitvorming, maar de klassieke rol van 'datawetenschapper' kan binnenkort een concept uit het verleden zijn. Wat nu nodig is, zijn professionals die vaardig zijn in het samenwerken met AI, het benutten van de mogelijkheden ervan en zich concentreren op strategisch denken en complexe probleemoplossing op een hoger niveau.
AI is niet het einde van analytics, inzichten of besluitvorming, het vertegenwoordigt hun evolutie . Het huidige veld van data science loopt het risico om verouderd te raken als het niet in de pas evolueert. AI is al bezig met het revolutioneren van industrieën, en data science moet zich aanpassen of het risico lopen door deze golf te worden ingehaald. Uiteindelijk is de vraag misschien niet of AI data science zal elimineren, maar of data science ooit volledig aan zijn beloften heeft voldaan.
Of misschien doet het onderscheid er niet eens toe als we eindelijk voorbij de hype rond ‘datawetenschap’ stappen en AI omarmen als de volgende logische stap.
Over mij: 25+ jaar IT-veteraan die data, AI, risicomanagement, strategie en onderwijs combineert. 4x hackathonwinnaar en maatschappelijke impact van data-advocaat. Werkt momenteel aan het opstarten van de AI-werknemers in de Filipijnen. Lees hier meer over mij: https://docligot.com