Nedávno jsem vedl kurz o využití datové vědy pro kybernetickou bezpečnost, se zaměřením na analýzu dat zachycených paketů – poněkud technické a tradičně suché téma. Přístup, o který jsem se podělil, čerpal z mých zkušeností s kybernetickou bezpečností ve finančních institucích, pokrýval základní kroky, jako je průzkumná analýza dat, předběžné zpracování a transformace logových dat a identifikace anomálií pomocí kombinace shlukování a analýzy grafové sítě.
Jedním překvapivým aspektem byl čas, který jsem strávil přípravou na toto sezení – zlomek toho, co bych obvykle investoval. AI hrála významnou roli při zefektivnění procesu. Použil jsem Claude, aby mi pomohl s kódováním, vývojem obrysu a dokonce i vytvářením snímků. Celkově byl celý kurz připraven do 48 hodin.
Sezení se ukázalo jako poutavé. Účastníci, především CISO, kteří obvykle nekódují, považovali cvičení vytvořená s pomocí AI za intuitivní a praktická. Mým cílem bylo ponořit je do přímé práce s daty a kódem. Zvláště ocenili možnost ručně prozkoumat, co moderní sledování kybernetických hrozeb a platformy SIEM obvykle automatizují, a získat tak přehled o procesech, které se odehrávají „pod pokličkou“.
Můj klíčový poznatek ze třídy byl překvapivě kontraintuitivní: datová věda, jak ji známe, bude nakonec nahrazena AI . Tento názor se může zdát předčasný – nebo možná předběhl svou dobu – ale je to perspektiva, která si zaslouží diskusi.
Varování: něco z toho může lidi vyvolat.
Již více než deset let je datová věda oslavována jako „nejsexy práce 21. století“. Přesto, jak se umělá inteligence rychle rozvíjí, začíná být jasné, že základní výzvy tohoto pole je těžší přehlédnout. Příchod výkonné generativní umělé inteligence by mohl být velmi dobře bodem zvratu pro disciplínu, která při zpětném pohledu mohla být volněji definovaná a přehnaně přehnaná, než se původně připouštělo.
Data science ve své podstatě kombinuje informatiku, statistiku a obchodní bystrost a nabízí organizacím příslib využitelných poznatků z obrovského množství dat. Tato sada dovedností je v dnešním světě založeném na datech nepopiratelně cenná. Pod svým vyleštěným obrazem však toto pole čelí významným problémům. To, co je často označováno jako datová věda, se často ukazuje jako slátanina volně souvisejících úkolů, které ne vždy přesně ladí, a mnoho profesionálů v oboru se potýká s celou šíří a složitostí, kterou obor vyžaduje.
Vzestup nástrojů řízených umělou inteligencí schopných zpracovávat analýzu dat, modelování a generování poznatků by si mohl vynutit posun v tom, jak nahlížíme na roli a budoucnost samotné datové vědy. Vzhledem k tomu, že umělá inteligence pokračuje ve zjednodušování a automatizaci mnoha základních úkolů v rámci datové vědy, může se obor potýkat s tím, co to skutečně znamená být datovým vědcem ve věku inteligentní automatizace.
Mnoho vědců zabývajících se daty, přestože má sofistikované kódovací dovednosti a digitální nástroje, se zabývá prací, která je překvapivě manuální a náchylná k chybám . Příprava, čištění a analýza dat zahrnují únavné, časově náročné úkoly, které se opakují a jsou mechanické. Ve skutečnosti je do přípravy datových sad vynaloženo značné množství práce v oblasti datové vědy – což je úkol, který často připomíná spíše dřinu než vzrušující vědu řízenou objevy, za kterou se vydává. Tento problém je umocněn skutečností, že mnozí, kteří vstupují do oboru, jsou v nejlepším případě amatéři. Poté, co absolvovali několik online kurzů v Pythonu nebo R, nejsou tito „datoví vědci“ často připraveni na náročnost této role . Datová věda není jen kódování. Zahrnuje hlubokou analýzu, porozumění kontextu a schopnost prezentovat poznatky netechnickému publiku. Ve skutečnosti je to spíše výzkumná práce, která vyžaduje směs kreativity a analytického myšlení, kterou mnozí v oboru prostě nemají.
Kromě toho si mnoho datových vědců vyvinulo pocit nároku, očekávají vysoké platy a lukrativní balíčky jen díky svému titulu. Tento přístup vypíná společnosti, zejména v odvětvích, kde je nákladová efektivita prvořadá. Setkal jsem se s firmami, které kdysi spěchaly najmout datové vědce, ale nyní to přehodnocují. Proč platit vysoké mzdy někomu, kdo tráví většinu času zápolením s čištěním dat, když AI to dokáže rychleji, lépe a za zlomek nákladů?
Jak jsem osobně zažil psaní kurzu, generativní umělá inteligence se vyvinula v mocnou sílu právě v oblastech, kde je datová věda nejslabší. Úkoly, jako je příprava dat, čištění a dokonce i základní kvalitativní analýza – činnosti, které zabírají velkou část času datových vědců – nyní systémy AI snadno automatizují . Horší (nebo lepší, podle toho, kde stojíte) je, že AI je rychlejší, přesnější a méně náchylná k lidským chybám nebo únavě.
Pro mnoho datových vědců to může být děsivé. Koneckonců, tyto úkoly představují většinu jejich každodenní práce. Čištění dat je například notoricky zdlouhavé a náchylné k chybám, ale umělá inteligence ho nyní dokáže provést několika kliknutími a téměř dokonalou přesností. Datoví vědci si často stěžují na tyto gruntové úkoly, přesto jsou pro jejich role zásadní. Jak se systémy umělé inteligence zlepšují, potřeba lidí vykonávat tyto práce klesá. Není žádným překvapením, že velká část hlasité kritiky proti umělé inteligenci pochází od samotných datových vědců . Vidí nápisy na zdi a bojí se o svou práci.
Aby toho pro datové vědce nebylo málo, tento obor v posledních letech výrazně nepokročil. Navzdory svému raketovému vzestupu popularity je datová věda stále sužována neefektivitou, chybami a nedostatkem jasného, co přesně by měla obnášet . Kdysi se věřilo, že důmyslnější nástroje a lepší školení povedou k rozvoji oboru, ale to se nenaplnilo v očekávané míře. Naproti tomu AI se neustále zlepšuje. Algoritmy strojového učení, zpracování přirozeného jazyka a generativní modely se rychle vyvíjejí a zanechávají tradiční datovou vědu v prachu.
Problém opět umocňují vysoká platová očekávání datových vědců. Společnosti, které mohly kdysi tolerovat neefektivitu, si nyní uvědomují, že umělá inteligence může nahradit spoustu práce, aniž by musela být spojena s vysokou cenou lidské práce. S tím, jak je umělá inteligence zběhlejší v provádění klíčových úkolů, jako je analýza, prognózování a dokonce i prezentace, se manuální povaha datové vědy stává stále více nadbytečnou. Mnoho společností si uvědomí, že to, co dříve vyžadovalo tým datových vědců, lze nyní efektivněji zvládnout pomocí nástrojů poháněných umělou inteligencí.
Realita je taková, že datová věda, jak je tradičně definována, je na pokraji zastaralosti. S tím, jak se generativní umělá inteligence rozvíjí ohromujícím tempem, poptávka po lidských vědcích v jejich současné podobě pravděpodobně klesne . To neznamená, že lidé nemají žádnou roli v rozhodování založeném na datech, ale role klasického „datového vědce“ může být brzy pojmem minulosti. Nyní potřebujeme profesionály, kteří jsou kvalifikovaní ve spolupráci s umělou inteligencí, využívají její schopnosti a zároveň se soustředí na strategické myšlení a komplexní řešení problémů na vyšší úrovni.
Umělá inteligence není koncem analýzy, postřehů nebo rozhodování – představuje jejich vývoj . Současný obor datové vědy riskuje, že zastará, pokud se nebude postupně vyvíjet. Umělá inteligence již revolucionizuje průmysl a datová věda se musí přizpůsobit, jinak riskuje, že bude touto vlnou překonána. Otázkou nakonec nemusí být, zda umělá inteligence odstraní datovou vědu, ale zda datová věda někdy plně splnila své sliby.
Nebo možná na rozdílu nezáleží ani v případě, že se konečně posuneme za humbuk „data science“ a přijmeme AI jako další logický postup.
O mně: Více než 25letý IT veterán kombinující data, AI, řízení rizik, strategii a vzdělávání. Čtyřnásobný vítěz hackathonu a sociální dopad od obhájce dat. V současné době pracujeme na nastartování pracovní síly AI na Filipínách. Více o mně se dozvíte zde: https://docligot.com