Es nesen vadīju nodarbību par datu zinātnes izmantošanu kiberdrošībā, koncentrējoties uz pakešu uztveršanas datu analīzi — tā ir nedaudz tehniska un tradicionāli sausa tēma. Pieeja, ar kuru es dalījos, balstījās uz manu pieredzi kiberdrošības jomā finanšu iestādēs, aptverot tādus galvenos soļus kā izpētes datu analīze, žurnālu datu pirmapstrāde un pārveidošana, kā arī anomāliju identificēšana, apvienojot klasteru un grafiku tīkla analīzi.
Viens pārsteidzošs aspekts bija laiks, ko pavadīju, gatavojoties šai sesijai — daļa no tā, ko parasti ieguldīju. AI bija nozīmīga loma procesa racionalizācijā. Es izmantoju Klodu, lai palīdzētu kodēt, izstrādāt kontūru un pat izveidot slaidus. Kopumā viss kurss bija gatavs 48 stundu laikā.
Sesija izvērtās saistoša. Dalībnieki, galvenokārt CISO, kuri parasti nekodē, uzskatīja, ka vingrinājumi, kas izstrādāti ar AI palīdzību, ir intuitīvi un praktiski. Mans mērķis bija iegremdēt viņus tiešā darbā ar datiem un kodu. Viņi īpaši novērtēja iespēju manuāli izpētīt, ko mūsdienu kiberdraudu novērošana un SIEM platformas parasti automatizē, gūstot ieskatu procesos, kas notiek "zem pārsega".
Mana galvenā atziņa no nodarbības bija pārsteidzoši pretrunīga: datu zinātne, kādu mēs to zinām, galu galā tiks aizstāta ar AI . Šis uzskats varētu šķist pāragrs vai varbūt apsteidzis savu laiku, taču tas ir perspektīva, kas attaisno diskusiju.
Brīdinājums: daži no tiem var iedarbināt cilvēkus.
Vairāk nekā desmit gadus datu zinātne tiek slavēta kā “21. gadsimta seksīgākais darbs”. Tomēr, AI strauji attīstoties, kļūst skaidrs, ka šīs jomas problēmas ir grūtāk nepamanīt. Spēcīga ģeneratīvā mākslīgā intelekta parādīšanās ļoti labi varētu būt pagrieziena punkts disciplīnai, kas, retrospektīvi, varētu būt definēta un pārspīlētāka, nekā sākotnēji tika atzīts.
Datu zinātne savā būtībā apvieno datorzinātnes, statistiku un biznesa iztēli, piedāvājot organizācijām reālu ieskatu no milzīga datu apjoma. Šis prasmju kopums nenoliedzami ir vērtīgs mūsdienu uz datiem balstītajā pasaulē. Tomēr zem tā noslīpētā tēla lauks saskaras ar būtiskām problēmām. Tas, kas bieži tiek apzīmēts kā datu zinātne, bieži vien izrādās vāji saistītu uzdevumu savārstījums, kas ne vienmēr ir precīzi saskaņots, un daudzi nozares profesionāļi cīnās ar visu disciplīnas prasīto plašumu un sarežģītību.
AI virzītu rīku pieaugums, kas spēj apstrādāt datu analīzi, modelēšanu un ieskatu radīšanu, varētu likt mainīt to, kā mēs skatāmies uz pašas datu zinātnes lomu un nākotni. Tā kā AI turpina vienkāršot un automatizēt daudzus datu zinātnes pamatuzdevumus, joma var saskarties ar aprēķiniem par to, ko īsti nozīmē būt datu zinātniekam viedās automatizācijas laikmetā.
Daudzi datu zinātnieki, neskatoties uz izsmalcinātām kodēšanas prasmēm un digitālajiem rīkiem, iesaistās darbā, kas ir pārsteidzoši manuāls un ir pakļauts kļūdām . Datu sagatavošana, tīrīšana un analīze ietver nogurdinošus, laikietilpīgus uzdevumus, kas ir atkārtoti un mehāniski. Faktiski ievērojams daudzums datu zinātnes darbaspēka tiek ieguldīts datu kopu sagatavošanā — uzdevums, kas bieži vien šķiet vairāk kā smags darbs, nevis aizraujoša, uz atklājumiem balstīta zinātne, par kuru tā tiek uzskatīta. Šo problēmu pastiprina fakts, ka daudzi, kas nāk laukumā, labākajā gadījumā ir amatieri. Apgūstot dažus tiešsaistes kursus Python vai R valodā, šie "datu zinātnieki" bieži vien nav sagatavoti stingrībai, ko viņi pilda . Datu zinātne nav tikai kodēšana. Tas ietver dziļu analīzi, kontekstuālo izpratni un spēju sniegt ieskatu auditorijai, kas nav tehniska. Patiesībā tas ir vairāk pētniecisks darbs, kas prasa radošuma un analītiskās domāšanas sajaukumu, kas daudziem šajā jomā vienkārši nepiemīt.
Turklāt daudzi datu zinātnieki ir attīstījuši tiesību sajūtu, sagaidot lielas algas un ienesīgas paketes tikai sava titula dēļ. Šāda attieksme atgrūž uzņēmumus, īpaši nozarēs, kur izmaksu efektivitāte ir vissvarīgākā. Esmu sastapies ar firmām, kas kādreiz steidzās nolīgt datu zinātniekus, bet tagad pārdomā. Kāpēc maksāt lielas algas kādam, kurš lielāko daļu laika pavada, cīnoties ar datu tīrīšanu, ja mākslīgais intelekts to var paveikt ātrāk, labāk un par nelielu izmaksu daļu?
Tā kā es personīgi piedzīvoju nodarbības rakstīšanu, ģeneratīvais AI ir kļuvis par spēcīgu spēku tajās jomās, kurās datu zinātne ir vājākā. Tādus uzdevumus kā datu sagatavošana, tīrīšana un pat pamata kvalitatīvā analīze — darbības, kas patērē daudz datu zinātnieka laika — tagad AI sistēmas viegli automatizē . Sliktāk (vai labāk, atkarībā no jūsu atrašanās vietas) ir tas, ka mākslīgais intelekts ir ātrāks, precīzāks un mazāk pakļauts cilvēka kļūdām vai nogurumam.
Daudziem datu zinātniekiem tas var būt biedējoši. Galu galā šie uzdevumi veido lielāko daļu viņu ikdienas darba. Piemēram, datu attīrīšana ir bēdīgi laikietilpīga un ir pakļauta kļūdām, taču AI tagad to var paveikt ar dažiem klikšķiem un gandrīz nevainojamu precizitāti. Datu zinātnieki bieži sūdzas par šiem rupjš uzdevumiem, tomēr tie ir viņu lomas pamatelementi. AI sistēmām pilnveidojoties, cilvēku nepieciešamība veikt šos darbus samazinās. Nav pārsteigums, ka lielāko daļu skaļās kritikas pret AI nāk no pašiem datu zinātniekiem . Viņi redz uzrakstu uz sienas un baidās par savu darbu.
Lai datu zinātnieku situāciju pasliktinātu, pēdējos gados šī joma nav guvusi ievērojamu progresu. Neraugoties uz straujo popularitātes pieaugumu, datu zinātni joprojām nomoka neefektivitāte, kļūdas un skaidrības trūkums par to, kam tieši tai vajadzētu būt . Kādreiz tika uzskatīts, ka joma attīstīs sarežģītākus rīkus un labāku apmācību, taču tas nav īstenojies gaidītajā apjomā. Turpretim mākslīgais intelekts ir nepārtraukti uzlabojies. Mašīnmācīšanās algoritmi, dabiskās valodas apstrāde un ģeneratīvie modeļi strauji attīstās, atstājot tradicionālo datu zinātni putekļos.
Atkal problēmu sarežģī datu zinātnieku lielās cerības uz algu. Uzņēmumi, kas kādreiz varēja paciest neefektivitāti, tagad saprot, ka mākslīgais intelekts var aizstāt lielu daļu sliktā darba bez cilvēka darbaspēka augstās cenas zīmes. AI kļūstot prasmīgākam tādu galveno uzdevumu veikšanā kā analīze, prognozēšana un pat prezentācija, datu zinātnes manuālais raksturs kļūst arvien liekāks. Daudzi uzņēmumi sapratīs, ka to, kam agrāk bija nepieciešama datu zinātnieku komanda, tagad var efektīvāk apstrādāt ar AI darbināmiem rīkiem.
Realitāte ir tāda, ka datu zinātne, kā tradicionāli definēta, atrodas uz novecošanas robežas. Tā kā ģeneratīvais mākslīgais intelekts attīstās pārsteidzošā ātrumā, pieprasījums pēc cilvēku datu zinātniekiem to pašreizējā formā, visticamāk, samazināsies . Tas nenozīmē, ka cilvēkiem nav nozīmes uz datiem balstītu lēmumu pieņemšanā, taču klasiskā “datu zinātnieka” loma drīzumā var būt pagātnes jēdziens. Tagad ir nepieciešami profesionāļi, kas prasmīgi sadarbojas ar AI, izmanto tā iespējas, vienlaikus koncentrējoties uz stratēģisko domāšanu un sarežģītu problēmu risināšanu augstākā līmenī.
AI nav analītikas, ieskatu vai lēmumu pieņemšanas beigas — tas atspoguļo to attīstību . Pašreizējā datu zinātnes joma var kļūt novecojusi, ja tā neattīstīsies pakāpeniski. AI jau tagad rada revolūciju nozarēs, un datu zinātnei ir jāpielāgojas, pretējā gadījumā pastāv risks, ka šis vilnis to pārņems. Galu galā jautājums var būt nevis par to, vai AI novērsīs datu zinātni, bet gan par to, vai datu zinātne kādreiz ir pilnībā izpildījusi savus solījumus.
Vai varbūt atšķirībai pat nav nozīmes, ja mēs beidzot virzāmies tālāk par "datu zinātnes" ažiotāžu un pieņemsim AI kā nākamo loģisko progresu.
Par mani: 25+ gadu IT veterāns, kas apvieno datus, AI, riska pārvaldību, stratēģiju un izglītību. 4x hakatona uzvarētājs un datu aizstāvja sociālā ietekme. Pašlaik strādā pie AI darbaspēka iedarbināšanas Filipīnās. Uzziniet vairāk par mani šeit: https://docligot.com