Ich habe kürzlich einen Kurs zum Einsatz von Data Science für die Cybersicherheit gehalten, bei dem ich mich auf die Analyse von Paketerfassungsdaten konzentrierte – ein eher technisches und traditionell trockenes Thema. Der Ansatz, den ich vorstellte, basierte auf meiner Erfahrung mit der Cybersicherheit in Finanzinstituten und umfasste Kernschritte wie explorative Datenanalyse, Vorverarbeitung und Transformation von Protokolldaten sowie die Identifizierung von Anomalien durch eine Kombination aus Clustering und Graphnetzwerkanalyse.
Überraschend war, wie viel Zeit ich für die Vorbereitung dieser Sitzung aufwenden musste – ein Bruchteil dessen, was ich normalerweise investieren würde. KI spielte eine wichtige Rolle bei der Optimierung des Prozesses. Claude half mir beim Codieren, beim Entwickeln der Gliederung und sogar beim Erstellen der Folien. Insgesamt war der gesamte Kurs innerhalb von 48 Stunden fertig.
Die Sitzung erwies sich als spannend. Die Teilnehmer, hauptsächlich CISOs, die normalerweise nicht programmieren, empfanden die mit Hilfe der KI erstellten Übungen als intuitiv und praxisnah. Mein Ziel war es, sie in die direkte Arbeit mit Daten und Code eintauchen zu lassen. Sie schätzten insbesondere die Möglichkeit, manuell zu erkunden, was moderne Cyberbedrohungsüberwachungs- und SIEM-Plattformen normalerweise automatisieren, und Einblicke in die Prozesse zu gewinnen, die „unter der Haube“ ablaufen.
Meine wichtigste Erkenntnis aus dem Kurs war überraschend kontraintuitiv: Die Datenwissenschaft, wie wir sie kennen, wird irgendwann durch KI ersetzt werden . Diese Ansicht mag verfrüht erscheinen – oder vielleicht ihrer Zeit voraus –, aber es ist eine Perspektive, die eine Diskussion verdient.
Achtung: Einige dieser Angaben könnten bei manchen Menschen zu Triggern führen.
Seit über einem Jahrzehnt wird die Datenwissenschaft als der „sexieste Beruf des 21. Jahrhunderts“ gefeiert. Doch angesichts der rasanten Fortschritte in der KI wird immer deutlicher, dass die grundlegenden Herausforderungen dieses Bereichs immer schwerer zu übersehen sind. Das Aufkommen einer leistungsstarken generativen KI könnte durchaus den Wendepunkt für eine Disziplin darstellen, die im Rückblick vielleicht lockerer definiert und überbewertet war, als zunächst angenommen.
Im Wesentlichen verbindet Data Science Informatik, Statistik und Geschäftssinn und bietet Unternehmen die Aussicht, aus riesigen Datenmengen umsetzbare Erkenntnisse zu gewinnen. Diese Fähigkeiten sind in der heutigen datengesteuerten Welt unbestreitbar wertvoll. Hinter seinem glänzenden Image verbirgt sich jedoch ein erhebliches Problem. Was oft als Data Science bezeichnet wird, entpuppt sich häufig als Flickenteppich lose miteinander verbundener Aufgaben, die nicht immer perfekt aufeinander abgestimmt sind, und viele Fachleute in diesem Bereich haben mit der Breite und Komplexität, die diese Disziplin erfordert, zu kämpfen.
Der Aufstieg KI-gesteuerter Tools, die Datenanalyse, Modellierung und Erkenntnisgewinnung bewältigen können, könnte zu einem Wandel unserer Sichtweise auf die Rolle und Zukunft der Datenwissenschaft selbst führen. Da KI weiterhin viele der grundlegenden Aufgaben der Datenwissenschaft vereinfacht und automatisiert, steht das Feld möglicherweise vor einer Frage, was es im Zeitalter der intelligenten Automatisierung wirklich bedeutet, ein Datenwissenschaftler zu sein.
Trotz ausgefeilter Programmierkenntnisse und digitaler Tools verrichten viele Datenwissenschaftler eine Arbeit, die überraschend manuell und fehleranfällig ist. Datenaufbereitung, -bereinigung und -analyse sind mühsame, zeitaufwändige, sich wiederholende und mechanische Aufgaben. Tatsächlich fließt ein erheblicher Teil der Arbeit der Datenwissenschaftler in die Vorbereitung von Datensätzen – eine Aufgabe, die sich oft mehr wie Plackerei anfühlt als wie die spannende, entdeckungsorientierte Wissenschaft, als die sie dargestellt wird. Dieses Problem wird dadurch verschärft, dass viele, die in das Feld einsteigen, bestenfalls Amateure sind. Diese „Datenwissenschaftler“ haben einige Onlinekurse in Python oder R besucht und sind daher oft nicht auf die Anforderungen dieses Jobs vorbereitet . Datenwissenschaft ist mehr als nur Programmieren. Sie umfasst tiefgehende Analysen, kontextuelles Verständnis und die Fähigkeit, Erkenntnisse einem nicht-technischen Publikum zu präsentieren. Tatsächlich ist es eher eine Forschungsarbeit, die eine Mischung aus Kreativität und analytischem Denken erfordert, über die viele in diesem Bereich einfach nicht verfügen.
Darüber hinaus haben viele Datenwissenschaftler ein Anspruchsdenken entwickelt und erwarten allein aufgrund ihres Titels hohe Gehälter und lukrative Vergütungen . Diese Einstellung schreckt Unternehmen ab, insbesondere in Branchen, in denen Kosteneffizienz an erster Stelle steht. Ich habe Firmen kennengelernt, die früher schnell Datenwissenschaftler eingestellt haben, dies jetzt aber überdenken. Warum sollte man jemandem, der die meiste Zeit mit der Datenbereinigung zu tun hat, hohe Löhne zahlen, wenn KI dies schneller, besser und zu einem Bruchteil der Kosten erledigen kann?
Wie ich persönlich beim Schreiben des Kurses erfahren habe, hat sich die generative KI zu einer mächtigen Kraft in genau den Bereichen entwickelt, in denen die Datenwissenschaft am schwächsten ist. Aufgaben wie Datenaufbereitung, -bereinigung und sogar grundlegende qualitative Analysen – Aktivitäten, die einen Großteil der Zeit eines Datenwissenschaftlers in Anspruch nehmen – können heute problemlos durch KI-Systeme automatisiert werden. Schlimmer (oder besser, je nachdem, wo man steht) ist, dass KI schneller, genauer und weniger anfällig für menschliches Versagen oder Ermüdung ist.
Für viele Datenwissenschaftler kann dies ein furchteinflößender Anblick sein. Schließlich machen diese Aufgaben den Großteil ihrer täglichen Arbeit aus. Die Datenbereinigung beispielsweise ist bekanntermaßen zeitaufwändig und fehleranfällig, aber KI kann dies heute mit wenigen Klicks und nahezu perfekter Präzision erledigen. Datenwissenschaftler beschweren sich oft über diese mühsamen Aufgaben, dabei sind sie für ihre Arbeit von grundlegender Bedeutung. Da sich KI-Systeme verbessern, wird es für diese Aufgaben immer weniger Menschen nötig sein. Es überrascht nicht, dass ein Großteil der lautstarken Kritik an KI von Datenwissenschaftlern selbst kommt . Sie sehen die Zeichen an der Wand und fürchten um ihre Jobs.
Was die Sache für Datenwissenschaftler noch schlimmer macht, ist, dass das Feld in den letzten Jahren keine nennenswerten Fortschritte gemacht hat. Trotz ihres kometenhaften Aufstiegs ist die Datenwissenschaft immer noch von Ineffizienzen, Fehlern und mangelnder Klarheit darüber geplagt, was sie genau beinhalten soll . Früher glaubte man, dass ausgefeiltere Tools und bessere Ausbildung das Feld weiterentwickeln würden, aber dies ist nicht im erwarteten Ausmaß eingetreten. Im Gegensatz dazu hat sich die KI stetig verbessert. Algorithmen für maschinelles Lernen, Verarbeitung natürlicher Sprache und generative Modelle entwickeln sich rasant weiter und lassen die traditionelle Datenwissenschaft weit hinter sich.
Auch hier wird das Problem durch die hohen Gehaltsvorstellungen von Datenwissenschaftlern noch verschärft . Unternehmen, die früher Ineffizienzen toleriert hätten, erkennen jetzt, dass KI einen Großteil der Routinearbeit ersetzen kann, ohne dass menschliche Arbeitskraft so teuer ist. Da KI immer besser darin wird, wichtige Aufgaben wie Analysen, Prognosen und sogar Präsentationen auszuführen , wird die manuelle Arbeit in der Datenwissenschaft zunehmend überflüssig. Viele Unternehmen werden erkennen, dass KI-gestützte Tools heute effizienter erledigen können, was früher ein Team von Datenwissenschaftlern erforderte.
Tatsächlich ist die Datenwissenschaft, wie sie traditionell definiert wird, kurz vor dem Aus. Da die generative KI sich mit erstaunlicher Geschwindigkeit weiterentwickelt, wird die Nachfrage nach menschlichen Datenwissenschaftlern in ihrer aktuellen Form wahrscheinlich zurückgehen . Das bedeutet nicht, dass Menschen bei datengesteuerten Entscheidungen keine Rolle mehr spielen, aber die klassische Rolle des „Datenwissenschaftlers“ könnte bald der Vergangenheit angehören. Was jetzt benötigt wird, sind Fachleute, die in der Zusammenarbeit mit KI geschult sind, ihre Fähigkeiten nutzen und sich gleichzeitig auf strategisches Denken und komplexe Problemlösungen auf höherer Ebene konzentrieren können.
KI ist nicht das Ende von Analysen, Erkenntnissen oder Entscheidungsfindungen – sie stellt ihre Weiterentwicklung dar . Das aktuelle Feld der Datenwissenschaft läuft Gefahr, obsolet zu werden, wenn es sich nicht im gleichen Maße weiterentwickelt. KI revolutioniert bereits Branchen, und die Datenwissenschaft muss sich anpassen, sonst besteht die Gefahr, von dieser Welle überrollt zu werden. Letztendlich lautet die Frage vielleicht nicht, ob KI die Datenwissenschaft verdrängen wird, sondern ob die Datenwissenschaft ihre Versprechen jemals vollständig einlösen konnte.
Oder vielleicht spielt dieser Unterschied nicht einmal eine Rolle, wenn wir den Hype um die „Datenwissenschaft“ endlich hinter uns lassen und KI als nächsten logischen Fortschritt akzeptieren.
Über mich: Über 25 Jahre IT-Erfahrung, die Daten, KI, Risikomanagement, Strategie und Bildung kombiniert. 4-facher Hackathon-Gewinner und sozialer Einfluss als Datenanwalt. Derzeit arbeite ich daran, die KI-Belegschaft auf den Philippinen anzukurbeln. Erfahren Sie hier mehr über mich: https://docligot.com