paint-brush
Mit tesz az AI az adattudományhozáltal@docligot
763 olvasmányok
763 olvasmányok

Mit tesz az AI az adattudományhoz

által Dominic Ligot5m2024/10/27
Read on Terminal Reader
Read this story w/o Javascript

Túl hosszú; Olvasni

Az adattudomány erősen kézi és vitatott természetére és az AI-ra való elkerülhetetlen átállásra való reflektálás
featured image - Mit tesz az AI az adattudományhoz
Dominic Ligot HackerNoon profile picture
0-item

Nemrég tartottam egy órát az adattudomány kiberbiztonsági felhasználásáról, a csomagrögzítési adatok elemzésére összpontosítva – ez egy kissé technikai és hagyományosan száraz téma. Az általam megosztott megközelítés a pénzügyi intézményeken belüli kiberbiztonság terén szerzett tapasztalataimból merített, amely olyan alapvető lépéseket fed le, mint a feltáró adatelemzés, a naplóadatok előfeldolgozása és átalakítása, valamint az anomáliák azonosítása a klaszterezés és a gráfhálózati elemzés kombinációjával.


Az egyik meglepő szempont az volt, hogy mennyi időt töltöttem erre a foglalkozásra való felkészüléssel – ez a töredéke annak, amit általában befektettem. Az AI jelentős szerepet játszott a folyamat egyszerűsítésében. Claude segítségével segítettem a kódolásban, a vázlat kidolgozásában és még a diák elkészítésében is. Összességében a teljes tanfolyam 48 órán belül elkészült.


A foglalkozás izgalmasnak bizonyult. A résztvevők, elsősorban a CISO-k, akik általában nem kódolnak, a mesterséges intelligencia segítségével elkészített gyakorlatokat intuitívnak és gyakorlatiasnak találták. Célom az volt, hogy elmerítsem őket az adatokkal és kódokkal való közvetlen munkában. Különösen nagyra értékelték a lehetőséget, hogy manuálisan feltárják, mit automatizálnak általában a modern kiberfenyegetés-felügyelet és a SIEM-platformok, így betekintést nyerhetnek a „burkolat alatt” zajló folyamatokba.


Meglepően ellentmondásos volt az osztály legfontosabb gondolata: az általunk ismert adattudományt végül az AI váltja fel . Ez a nézet korainak tűnhet – vagy talán megelőzte a korát –, de ez egy olyan perspektíva, amely vitát igényel.


Figyelmeztetés: ezek egy része beindíthatja az embereket.

A szex a poggyász

Az adattudományt több mint egy évtizede a „21. század legszexibb munkájaként” ünneplik. Ám ahogy a mesterséges intelligencia gyorsan fejlődik, világossá válik, hogy a terület alapvető kihívásait nehezebb figyelmen kívül hagyni. Az erőteljes generatív mesterséges intelligencia megjelenése nagyon is kitörési pont lehet egy olyan tudományág számára, amely utólag visszatekintve lazábban definiált és túlzásba vitt, mint azt eredetileg elismerték.


Lényegében az adattudomány egyesíti a számítástechnikát, a statisztikát és az üzleti érzéket, és a szervezetek számára azt az ígéretet kínálja, hogy hatalmas mennyiségű adatból hasznosítható betekintést nyerjenek. Ez a képességkészlet tagadhatatlanul értékes a mai adatközpontú világban. A mező azonban a csiszolt arculata alatt jelentős problémákkal néz szembe. Amiről gyakran adattudománynak neveznek, gyakran kiderül, hogy lazán összefüggő feladatok foltjai, amelyek nem mindig illeszkednek pontosan, és a terület sok szakembere küzd a tudományág által megkívánt teljes terjedelműséggel és összetettséggel.


Az adatelemzésre, modellezésre és insight generálására alkalmas mesterséges intelligencia által vezérelt eszközök térnyerése megváltoztathatja azt, ahogyan magának az adattudománynak a szerepét és jövőjét tekintjük. Ahogy a mesterséges intelligencia folytatja az adattudományon belüli számos alapvető feladat egyszerűsítését és automatizálását, a területnek el kell számolnia azzal kapcsolatban, hogy mit jelent valójában adattudósnak lenni az intelligens automatizálás korában.

A repedések

Sok adattudós, annak ellenére, hogy kifinomult kódolási készségekkel és digitális eszközökkel rendelkezik, meglepően manuális és hibákra hajlamos munkát végez. Az adatok előkészítése, tisztítása és elemzése fárasztó, időigényes, ismétlődő és mechanikus feladatokat foglal magában. Valójában jelentős mennyiségű adattudományi munkát fordítanak az adatkészletek elkészítésére – ez a feladat gyakran inkább fáradságnak tűnik, mint az izgalmas, felfedezések által vezérelt tudománynak. Ezt a problémát tetézi, hogy sokan, akik pályára lépnek, legjobb esetben is amatőrök. Miután elvégeztek néhány Python vagy R online tanfolyamot, ezek az "adattudósok" gyakran nincsenek felkészülve a szerep szigorára . Az adattudomány nem csak kódolás. Ez magában foglalja a mély elemzést, a kontextuális megértést, és azt a képességet, hogy betekintést nyújtson a nem technikai közönségnek. Valójában ez inkább egy kutatói munka, amely a kreativitás és az elemző gondolkodás ötvözetét igényli, amivel a területen sokan egyszerűen nem rendelkeznek.


Ezen túlmenően sok adatkutatóban kialakult a jogosultság érzése, akik már csak a címüknél fogva magas fizetéseket és jövedelmező csomagokat várnak el . Ez a hozzáállás elriasztja a vállalatokat, különösen azokban az ágazatokban, ahol a költséghatékonyság a legfontosabb. Találkoztam olyan cégekkel, amelyek egykor siettek adattudósokat felvenni, de most újragondolják. Miért fizessen magas fizetést annak, aki ideje nagy részét adattisztítással birkózik, ha a mesterséges intelligencia gyorsabban, jobban és a költségek töredékéért is meg tudja csinálni?

AI Ki?

Amint személyesen megtapasztaltam az óra megírását, a Generatív AI hatalmas erővé fejlődött azokon a területeken, ahol az adattudomány a leggyengébb. Az olyan feladatokat, mint az adat-előkészítés, a tisztítás és még az alapvető kvalitatív elemzés – amelyek az adattudósok idejének nagy részét emésztik fel – ma már könnyen automatizálják az AI-rendszerek . Ami még rosszabb (vagy jobb, attól függően, hogy hol állsz), az az, hogy a mesterséges intelligencia gyorsabb, pontosabb, és kevésbé hajlamos az emberi hibákra vagy a fáradtságra.


Sok adattudós számára ez ijesztő lehet. Végül is ezek a feladatok jelentik a napi munkájuk nagy részét. Az adattisztítás például köztudottan időigényes és hajlamos a hibákra, de a mesterséges intelligencia most néhány kattintással és csaknem tökéletes precizitással meg tudja valósítani. Az adattudósok gyakran panaszkodnak ezekre a morgós feladatokra, de ezek alapvető szerepet töltenek be szerepükben. Ahogy a mesterséges intelligencia rendszerek javulnak, egyre csökken az embereknek ezeknek a munkáknak az igénye. Nem meglepő, hogy a mesterséges intelligencia elleni hangos kritikák nagy része maguktól az adatkutatóktól származik . Látják az írást a falon, és féltik a munkájukat.

A kishitűség

Az adattudósok helyzetét rontja, hogy a terület nem ért el jelentős előrelépést az elmúlt években. A népszerűségének rohamos növekedése ellenére az adattudományt még mindig sújtják a hatékonyság hiánya, a hibák és az egyértelműség hiánya, hogy pontosan mit is takar . Valamikor azt hitték, hogy kifinomultabb eszközök és jobb képzés továbbfejleszti a területet, de ez nem valósult meg a várt mértékben. Ezzel szemben az AI folyamatosan javult. A gépi tanulási algoritmusok, a természetes nyelvi feldolgozás és a generatív modellek gyorsan fejlődnek, így a hagyományos adattudomány a porban marad.


Az adatkutatók magas fizetési elvárásai ismét csak tovább bonyolítják a kérdést . Azok a vállalatok, amelyek valaha tolerálták a hatékonyság hiányát, most már rájöttek, hogy a mesterséges intelligencia sok zűrös munkát képes helyettesíteni anélkül, hogy az emberi munkához kötődő borsos árcédula kellene. Mivel a mesterséges intelligencia egyre ügyesebben hajt végre olyan kulcsfontosságú feladatokat, mint az elemzés, az előrejelzés, sőt a prezentáció is, az adattudomány manuális jellege egyre feleslegesebbé válik. Sok vállalat rájön, hogy ami korábban egy adattudós csapatot igényelt, az ma már hatékonyabban kezelhető a mesterséges intelligencia által hajtott eszközökkel.

A műszak

A valóság az, hogy az adattudomány a hagyományosan meghatározottak szerint az elavulás szélén áll. A generatív mesterséges intelligencia elképesztő ütemben fejlődik, a humán adatokkal foglalkozó tudósok iránti kereslet a jelenlegi formájában valószínűleg csökkenni fog . Ez nem jelenti azt, hogy az embernek ne lenne szerepe az adatvezérelt döntéshozatalban, de a klasszikus „adattudós” szerep hamarosan a múlt fogalma lehet. Most olyan szakemberekre van szükség, akik jártasak az AI-val való együttműködésben, kihasználva annak képességeit, miközben a stratégiai gondolkodásra és a magasabb szintű komplex problémamegoldásra koncentrálnak.


A mesterséges intelligencia nem jelenti az elemzés, a betekintés vagy a döntéshozatal végét – ez az evolúciójukat mutatja be . Az adattudomány jelenlegi területe azt kockáztatja, hogy elavulttá válik, ha nem fejlődik lépésről lépésre. A mesterséges intelligencia már most forradalmasítja az iparágakat, és az adattudománynak alkalmazkodnia kell, különben fennáll annak a veszélye, hogy utoléri ez a hullám. Végső soron nem az a kérdés, hogy a mesterséges intelligencia megszünteti-e az adattudományt, hanem az, hogy az adattudomány valaha is teljes mértékben beváltotta-e ígéreteit.


Vagy talán nem is számít a megkülönböztetés, ha végre túllépünk az „adattudományi” hírverésen, és a mesterséges intelligencia a következő logikai lépésként fog fel.



Rólam: 25 év feletti informatikai veterán, aki egyesíti az adatokat, az AI-t, a kockázatkezelést, a stratégiát és az oktatást. 4x hackathon győztes és társadalmi hatás az adatvédőtől. Jelenleg a Fülöp-szigeteki mesterséges intelligencia munkaerő felgyorsításán dolgozik. Tudjon meg többet rólam itt: https://docligot.com