Niedawno przeprowadziłem zajęcia na temat wykorzystania nauki o danych do cyberbezpieczeństwa, skupiając się na analizie danych przechwytywania pakietów — nieco technicznym i tradycyjnie suchym temacie. Podejście, którym się podzieliłem, czerpało z mojego doświadczenia w cyberbezpieczeństwie w instytucjach finansowych, obejmując podstawowe kroki, takie jak eksploracyjna analiza danych, wstępne przetwarzanie i transformacja danych dziennika oraz identyfikacja anomalii poprzez połączenie analizy klastrowania i sieci grafów.
Jednym z zaskakujących aspektów był czas, jaki poświęciłem na przygotowanie się do tej sesji — ułamek tego, co zwykle poświęcam. AI odegrała znaczącą rolę w usprawnieniu procesu. Skorzystałem z pomocy Claude'a przy kodowaniu, opracowaniu konspektu, a nawet tworzeniu slajdów. W sumie cały kurs był gotowy w ciągu 48 godzin.
Sesja okazała się angażująca. Uczestnicy, głównie CISO, którzy zazwyczaj nie kodują, uznali ćwiczenia, opracowane przy pomocy AI, za intuicyjne i praktyczne. Moim celem było zanurzenie ich w pracy bezpośrednio z danymi i kodem. Szczególnie docenili szansę na ręczne zbadanie tego, co nowoczesne platformy nadzoru cyberzagrożeń i SIEM zazwyczaj automatyzują, uzyskując wgląd w procesy zachodzące „pod maską”.
Mój najważniejszy wniosek z zajęć był zaskakująco sprzeczny z intuicją: nauka o danych, jaką znamy, zostanie ostatecznie zastąpiona przez sztuczną inteligencję . Ten pogląd może wydawać się przedwczesny — lub może wyprzedzający swoje czasy — ale jest to perspektywa, która zasługuje na dyskusję.
Ostrzeżenie: niektóre treści mogą kogoś urazić.
Od ponad dekady nauka o danych jest uznawana za „najseksowniejszy zawód XXI wieku”. Jednak wraz z szybkim postępem AI staje się jasne, że trudniej jest przeoczyć podstawowe wyzwania tej dziedziny. Nadejście potężnej generatywnej AI może być punktem zwrotnym dla dyscypliny, która z perspektywy czasu mogła być luźniej zdefiniowana i przesadnie rozreklamowana, niż początkowo sądzono.
W swej istocie nauka o danych łączy informatykę, statystykę i wiedzę biznesową, oferując organizacjom obietnicę praktycznych spostrzeżeń z ogromnych ilości danych. Ten zestaw umiejętności jest niewątpliwie cenny w dzisiejszym świecie napędzanym danymi. Jednak pod swoim wypolerowanym wizerunkiem dziedzina ta stoi w obliczu poważnych problemów. To, co często jest określane jako nauka o danych, często okazuje się być zlepkiem luźno powiązanych zadań, które nie zawsze są ze sobą zgrabnie powiązane, a wielu profesjonalistów w tej dziedzinie zmaga się z pełną szerokością i złożonością, jakiej wymaga ta dyscyplina.
Rozwój narzędzi opartych na sztucznej inteligencji, które są w stanie obsługiwać analizę danych, modelowanie i generowanie spostrzeżeń, może wymusić zmianę w postrzeganiu roli i przyszłości samej nauki o danych. W miarę jak sztuczna inteligencja nadal upraszcza i automatyzuje wiele podstawowych zadań w nauce o danych, dziedzina ta może stanąć przed rozliczeniem tego, co naprawdę oznacza bycie naukowcem zajmującym się danymi w erze inteligentnej automatyzacji.
Wielu naukowców zajmujących się danymi, mimo że dysponują zaawansowanymi umiejętnościami kodowania i narzędziami cyfrowymi, podejmuje się pracy, która jest zaskakująco ręczna i podatna na błędy . Przygotowywanie, oczyszczanie i analiza danych obejmują żmudne, czasochłonne zadania, które są powtarzalne i mechaniczne. W rzeczywistości znaczna część pracy naukowców zajmujących się danymi jest poświęcona przygotowywaniu zestawów danych — zadaniu, które często wydaje się bardziej żmudne niż ekscytująca, oparta na odkryciach nauka, za jaką się uważa. Problem ten pogłębia fakt, że wielu, którzy wchodzą do tej dziedziny, to w najlepszym razie amatorzy. Po ukończeniu kilku kursów online z Pythona lub R, ci „naukowcy zajmujący się danymi” często nie są przygotowani do rygorów tej roli . Nauka o danych to nie tylko kodowanie. Obejmuje głęboką analizę, zrozumienie kontekstu i umiejętność prezentowania spostrzeżeń odbiorcom nietechnicznym. W rzeczywistości jest to raczej praca badawcza, wymagająca połączenia kreatywności i analitycznego myślenia, których wielu w tej dziedzinie po prostu nie posiada.
Ponadto wielu naukowców zajmujących się danymi rozwinęło poczucie uprawnień, oczekując wysokich pensji i lukratywnych pakietów tylko z racji swojego tytułu. Taka postawa zniechęca firmy, szczególnie w sektorach, w których najważniejsza jest efektywność kosztowa. Spotkałem firmy, które kiedyś spieszyły się z zatrudnianiem naukowców zajmujących się danymi, ale teraz rozważają to na nowo. Po co płacić wysokie pensje komuś, kto większość czasu spędza na zmaganiach z oczyszczaniem danych, skoro sztuczna inteligencja może robić to szybciej, lepiej i za ułamek kosztów?
Jak sam osobiście doświadczyłem, pisząc kurs, Generative AI rozwinęło się w potężną siłę w obszarach, w których nauka o danych jest najsłabsza. Zadania takie jak przygotowywanie danych, oczyszczanie, a nawet podstawowa analiza jakościowa — czynności, które pochłaniają większość czasu naukowca zajmującego się danymi — są teraz łatwo automatyzowane przez systemy AI . Co gorsze (lub lepsze, w zależności od tego, gdzie się znajdujesz) jest to, że AI jest szybsza, dokładniejsza i mniej podatna na błędy ludzkie lub zmęczenie.
Dla wielu naukowców zajmujących się danymi może to być przerażające. W końcu zadania te stanowią większość ich codziennej pracy. Na przykład oczyszczanie danych jest notorycznie czasochłonne i podatne na błędy, ale teraz sztuczna inteligencja może to zrobić kilkoma kliknięciami i niemal idealną precyzją. Naukowcy zajmujący się danymi często narzekają na te żmudne zadania, mimo że są one podstawą ich roli. W miarę doskonalenia systemów AI zapotrzebowanie na ludzi do wykonywania tych zadań maleje. Nic dziwnego, że większość głośnej krytyki wobec AI pochodzi od samych naukowców zajmujących się danymi . Widzą pismo na ścianie i boją się o swoją pracę.
Co gorsza dla naukowców zajmujących się danymi, dziedzina ta nie poczyniła znaczących postępów w ostatnich latach. Pomimo błyskawicznego wzrostu popularności, nauka o danych nadal jest nękana nieefektywnością, błędami i brakiem jasności co do tego, na czym dokładnie powinna polegać . Kiedyś uważano, że bardziej wyrafinowane narzędzia i lepsze szkolenia rozwiną tę dziedzinę, ale nie zmaterializowało się to w oczekiwanym stopniu. Wręcz przeciwnie, sztuczna inteligencja stale się poprawia. Algorytmy uczenia maszynowego, przetwarzanie języka naturalnego i modele generatywne szybko ewoluują, pozostawiając tradycyjną naukę o danych w tyle.
Ponownie, wysokie oczekiwania płacowe naukowców zajmujących się danymi pogłębiają problem . Firmy, które kiedyś mogły tolerować nieefektywność, teraz zdają sobie sprawę, że AI może zastąpić wiele ciężkiej pracy bez wysokiej ceny związanej z pracą człowieka. Ponieważ AI staje się coraz bardziej biegła w wykonywaniu kluczowych zadań, takich jak analiza, prognozowanie, a nawet prezentacja, ręczna natura nauki o danych staje się coraz bardziej zbędna. Wiele firm zda sobie sprawę, że to, co kiedyś wymagało zespołu naukowców zajmujących się danymi, może być teraz obsługiwane wydajniej przez narzędzia oparte na AI.
Rzeczywistość jest taka, że nauka o danych, tak jak jest tradycyjnie definiowana, jest na skraju przestarzałości. Wraz z rozwojem generatywnej AI w zadziwiającym tempie, zapotrzebowanie na ludzkich naukowców zajmujących się danymi w ich obecnej formie prawdopodobnie spadnie . Nie oznacza to, że ludzie nie odgrywają żadnej roli w podejmowaniu decyzji opartych na danych, ale klasyczna rola „naukowca zajmującego się danymi” może wkrótce stać się koncepcją przeszłości. Teraz potrzebni są profesjonaliści, którzy potrafią współpracować z AI, wykorzystywać jej możliwości, a jednocześnie koncentrować się na myśleniu strategicznym i rozwiązywaniu złożonych problemów na wyższym poziomie.
AI nie jest końcem analityki, spostrzeżeń ani podejmowania decyzji — reprezentuje ich ewolucję . Obecna dziedzina nauki o danych ryzykuje, że stanie się przestarzała, jeśli nie będzie ewoluować krok po kroku. AI już rewolucjonizuje branże, a nauka o danych musi się dostosować lub ryzykuje, że zostanie wyprzedzona przez tę falę. Ostatecznie pytanie może nie brzmieć, czy AI wyeliminuje naukę o danych, ale czy nauka o danych kiedykolwiek w pełni spełniła swoje obietnice.
A może to rozróżnienie nie będzie miało żadnego znaczenia, jeśli w końcu wyjdziemy poza szum wokół „nauki o danych” i zaakceptujemy sztuczną inteligencję jako kolejny logiczny krok naprzód.
O mnie: Ponad 25-letni weteran IT łączący dane, AI, zarządzanie ryzykiem, strategię i edukację. 4-krotny zwycięzca hackathonu i wpływ społeczny od rzecznika danych. Obecnie pracuję nad ożywieniem siły roboczej AI na Filipinach. Dowiedz się więcej o mnie tutaj: https://docligot.com