Վերջերս ես անցկացրեցի դաս կիբերանվտանգության համար տվյալների գիտության օգտագործման վերաբերյալ՝ կենտրոնանալով փաթեթների հավաքագրման տվյալների վերլուծության վրա՝ որոշակիորեն տեխնիկական և ավանդաբար չոր թեմա: Մոտեցումը, որը ես կիսեցի, բխում էր ֆինանսական հաստատությունների ներսում կիբերանվտանգության իմ փորձից՝ ընդգրկելով հիմնական քայլերը, ինչպիսիք են հետազոտական տվյալների վերլուծությունը, նախնական մշակումը և վերափոխումը գրանցամատյանների տվյալների, ինչպես նաև անոմալիաների բացահայտումը կլաստերի և գրաֆիկական ցանցի վերլուծության միջոցով:
Զարմանալի ասպեկտներից մեկն այն ժամանակն էր, որը ես ծախսեցի այս նստաշրջանին պատրաստվելու համար՝ մի փոքր մասն այն ամենի, ինչ ես սովորաբար ներդնում էի: AI-ն նշանակալի դեր է խաղացել գործընթացի պարզեցման գործում: Ես օգտագործեցի Կլոդին կոդավորման, ուրվագիծը մշակելու և նույնիսկ սլայդներ ստեղծելու համար: Ընդհանուր առմամբ, ամբողջ դասընթացը պատրաստ էր 48 ժամվա ընթացքում։
Նիստը գրավիչ ստացվեց. Մասնակիցները, հիմնականում CISO-ները, ովքեր սովորաբար չեն կոդավորում, պարզեցին, որ AI-ի օգնությամբ ստեղծված վարժությունները ինտուիտիվ և գործնական են: Իմ նպատակն էր ընկղմել նրանց ուղղակիորեն տվյալների և կոդի հետ աշխատելու մեջ: Նրանք հատկապես գնահատեցին ձեռքով ուսումնասիրելու հնարավորությունը, թե ժամանակակից կիբերսպառնալիքների հսկողությունը և SIEM հարթակները սովորաբար ավտոմատացնում են՝ ստանալով պատկերացումներ այն գործընթացների մասին, որոնք տեղի են ունենում «գլխարկի տակ»:
Դասից իմ հիմնական կետը զարմանալիորեն հակասական էր. տվյալների գիտությունը, ինչպես մենք գիտենք, ի վերջո կփոխարինվի AI-ով : Այս տեսակետը կարող է թվալ վաղաժամ, կամ գուցե իր ժամանակից շուտ, բայց դա մի հեռանկար է, որը պահանջում է քննարկում:
Զգուշացում. դրանցից մի քանիսը կարող են առաջացնել մարդկանց:
Ավելի քան մեկ տասնամյակ տվյալների գիտությունը նշվում է որպես «21-րդ դարի ամենասեքսուալ աշխատանքը»: Այնուամենայնիվ, երբ AI-ն արագորեն զարգանում է, պարզ է դառնում, որ ոլորտի հիմքում ընկած մարտահրավերներն ավելի դժվար է անտեսել: Հզոր գեներատիվ արհեստական ինտելեկտի հայտնվելը շատ լավ կարող է հանգուցային կետ լինել մի կարգապահության համար, որը, հետահայաց հայացքով, կարող էր ավելի թույլ սահմանվել և գերագնահատված լինել, քան ի սկզբանե ընդունվել էր:
Իր էությամբ տվյալների գիտությունը միավորում է համակարգչային գիտությունը, վիճակագրությունը և բիզնեսի խորաթափանցությունը՝ կազմակերպություններին առաջարկելով հսկայական քանակությամբ տվյալների գործնական պատկերացումների խոստում: Այս հմտությունների հավաքածուն անհերքելիորեն արժեքավոր է այսօրվա տվյալների վրա հիմնված աշխարհում: Այնուամենայնիվ, իր հղկված պատկերի տակ դաշտը բախվում է էական խնդիրների: Այն, ինչ հաճախ պիտակավորվում է որպես տվյալների գիտություն, հաճախ պարզվում է, որ այն անփույթ առնչվող առաջադրանքների կարկատան է, որոնք միշտ չէ, որ կոկիկորեն համընկնում են, և ոլորտի շատ մասնագետներ պայքարում են այն ամբողջ լայնության և բարդության դեմ, որը պահանջում է կարգապահությունը:
AI-ի վրա հիմնված գործիքների աճը, որոնք ունակ են կարգավորել տվյալների վերլուծությունը, մոդելավորումը և պատկերացում ստեղծելը, կարող է ստիպել փոխել այն, թե ինչպես ենք մենք դիտարկում բուն տվյալների գիտության դերն ու ապագան: Քանի որ AI-ն շարունակում է պարզեցնել և ավտոմատացնել տվյալների գիտության մեջ հիմնարար առաջադրանքներից շատերը, ոլորտը կարող է հաշվի առնել, թե իրականում ինչ է նշանակում լինել տվյալների գիտնական խելացի ավտոմատացման դարաշրջանում:
Տվյալների շատ գիտնականներ, չնայած տիրապետում են կոդավորման բարդ հմտություններին և թվային գործիքներին, զբաղվում են աշխատանքի մեջ, որը զարմանալիորեն ձեռքով է և հակված է սխալների : Տվյալների պատրաստումը, մաքրումը և վերլուծությունը ներառում են հոգնեցուցիչ, ժամանակատար առաջադրանքներ, որոնք կրկնվող և մեխանիկական են: Իրականում, տվյալների գիտության աշխատանքի զգալի քանակն ուղղվում է տվյալների շտեմարանների պատրաստմանը, մի խնդիր, որը հաճախ ավելի շատ դժվարություն է թվում, քան հայտնագործությունների վրա հիմնված հետաքրքիր գիտություն: Այս խնդիրը բարդանում է նրանով, որ դաշտ մտնողներից շատերը լավագույն դեպքում սիրողական են: Python-ի կամ R-ի մի քանի առցանց դասընթացներ անցնելով՝ այս «տվյալների գիտնականները» հաճախ պատրաստ չեն դերի խստությանը : Տվյալների գիտությունը պարզապես կոդավորում չէ: Այն ներառում է խորը վերլուծություն, համատեքստային ըմբռնում և ոչ տեխնիկական լսարանին պատկերացումներ ներկայացնելու կարողություն: Իրականում, դա ավելի շատ հետազոտական աշխատանք է, որը պահանջում է ստեղծագործական և վերլուծական մտածողության խառնուրդ, որը ոլորտում շատերը պարզապես չունեն:
Ավելին, տվյալների շատ գիտնականներ զարգացրել են իրավունքի զգացում` ակնկալելով բարձր աշխատավարձեր և շահութաբեր փաթեթներ հենց իրենց կոչման շնորհիվ: Այս վերաբերմունքը խանգարում է ընկերություններին, հատկապես այն ոլորտներում, որտեղ ծախսերի արդյունավետությունը առաջնային է: Ես հանդիպել եմ ընկերությունների, որոնք ժամանակին շտապում էին տվյալների գիտնականներ վարձել, բայց այժմ վերանայում են: Ինչու՞ բարձր աշխատավարձ վճարել մեկին, ով իր ժամանակի մեծ մասը ծախսում է տվյալների մաքրման հետ պայքարում, երբ AI-ն կարող է դա անել ավելի արագ, ավելի լավ և ծախսերի չնչին չափով:
Քանի որ ես անձամբ փորձեցի դասը գրել, Generative AI-ն վերածվել է հզոր ուժի հենց այն ոլորտներում, որտեղ տվյալների գիտությունն ամենաթույլն է: Տվյալների պատրաստումը, մաքրումը և նույնիսկ տարրական որակական վերլուծությունը՝ գործողություններ, որոնք խլում են տվյալների գիտնականի ժամանակի մեծ մասը, այժմ հեշտությամբ ավտոմատացվում են AI համակարգերի կողմից : Ավելի վատն է (կամ ավելի լավը, կախված նրանից, թե որտեղ եք կանգնած) այն է, որ AI-ն ավելի արագ է, ավելի ճշգրիտ և ավելի քիչ հակված մարդկային սխալի կամ հոգնածության:
Տվյալների շատ գիտնականների համար սա կարող է սարսափելի լինել: Ի վերջո, այս առաջադրանքները ներկայացնում են նրանց ամենօրյա աշխատանքի հիմնական մասը: Տվյալների մաքրումը, օրինակ, տխրահռչակ ժամանակատար է և հակված է սխալների, բայց AI-ն այժմ կարող է դա իրականացնել մի քանի կտտոցով և գրեթե կատարյալ ճշգրտությամբ: Տվյալների գիտնականները հաճախ դժգոհում են այս խրթխրթան առաջադրանքներից, սակայն դրանք հիմնարար նշանակություն ունեն իրենց դերի համար: Քանի որ AI համակարգերը բարելավվում են, մարդկանց կողմից այդ աշխատանքները կատարելու անհրաժեշտությունը նվազում է: Զարմանալի չէ, որ AI-ի դեմ հնչեղ քննադատությունների մեծ մասը գալիս է հենց տվյալների գիտնականներից : Նրանք տեսնում են պատի գրությունը և վախենում են իրենց աշխատանքի համար:
Տվյալների գիտնականների համար իրավիճակը ավելի վատթարացնելու համար ոլորտը վերջին տարիներին զգալի առաջընթաց չի գրանցել: Չնայած իր ժողովրդականության մետեորիկ աճին, տվյալների գիտությունը դեռևս տառապում է անարդյունավետությամբ, սխալներով և հստակության պակասով, թե կոնկրետ ինչ պետք է պարունակի այն : Ժամանակին ենթադրվում էր, որ ավելի բարդ գործիքները և ավելի լավ ուսուցումը կզարգացնեն ոլորտը, բայց դա չիրականացավ այնքան, որքան ակնկալվում էր: Ի հակադրություն, AI-ն անշեղորեն բարելավվել է: Մեքենայի ուսուցման ալգորիթմները, բնական լեզվի մշակումը և գեներատիվ մոդելները արագորեն զարգանում են՝ թողնելով ավանդական տվյալների գիտությունը փոշու մեջ:
Կրկին, տվյալների գիտնականների բարձր աշխատավարձի ակնկալիքները բարդացնում են խնդիրը : Ընկերությունները, որոնք ժամանակին կարող էին հանդուրժել անարդյունավետությունը, այժմ հասկանում են, որ արհեստական ինտելեկտը կարող է փոխարինել մեծ թվով ծանր աշխատանք՝ առանց մարդկային աշխատանքին առնչվող ահռելի գնի: Քանի որ AI-ն ավելի հմուտ է դառնում հիմնական առաջադրանքների կատարման մեջ, ինչպիսիք են վերլուծությունը, կանխատեսումը և նույնիսկ ներկայացումը, տվյալների գիտության ձեռքի բնույթը գնալով ավելորդ է դառնում: Շատ ընկերություններ կհասկանան, որ այն, ինչ նախկինում պահանջում էր տվյալների գիտնականների թիմ, այժմ կարող է ավելի արդյունավետ կերպով կարգավորվել արհեստական ինտելեկտի վրա աշխատող գործիքների միջոցով:
Իրականությունն այն է, որ տվյալների գիտությունը, ինչպես ավանդաբար սահմանվում է, գտնվում է հնացման եզրին: Զարմանալի տեմպերով գեներատիվ ինտելեկտուալ ինտելեկտի առաջընթացով, մարդկային տվյալների գիտնականների պահանջարկն իրենց ներկայիս տեսքով, հավանաբար, կնվազի : Սա չի նշանակում, որ մարդիկ որևէ դեր չունեն տվյալների վրա հիմնված որոշումների կայացման գործում, սակայն դասական «տվյալների գիտնական» դերը շուտով կարող է դառնալ անցյալի հայեցակարգ: Այն, ինչ այժմ անհրաժեշտ է, արհեստավարժ ինտելեկտի հետ համագործակցելու հմուտ մասնագետներ են, որոնք կօգտագործեն նրա հնարավորությունները՝ միաժամանակ կենտրոնանալով ռազմավարական մտածողության և ավելի բարձր մակարդակի բարդ խնդիրների լուծման վրա:
AI-ն վերլուծության, պատկերացումների կամ որոշումների կայացման վերջը չէ, այն ներկայացնում է դրանց էվոլյուցիան : Տվյալների գիտության ներկայիս ոլորտը կարող է հնանալ, եթե այն չզարգանա քայլ առ քայլ: AI-ն արդեն իսկ հեղափոխություն է անում արդյունաբերության մեջ, և տվյալների գիտությունը պետք է հարմարվի կամ ռիսկի ենթարկվի այս ալիքի կողմից: Ի վերջո, հարցը կարող է լինել ոչ թե AI-ն կվերացնի տվյալների գիտությունը, այլ արդյոք տվյալների գիտությունը երբևէ ամբողջությամբ կատարել է իր խոստումները:
Կամ գուցե տարբերությունը նույնիսկ նշանակություն չունի, եթե մենք վերջապես դուրս գանք «տվյալների գիտության» հիպից և ընդունենք AI-ն որպես հաջորդ տրամաբանական առաջընթաց:
Իմ մասին. 25+ տարվա ՏՏ վետերան՝ համատեղելով տվյալները, AI, ռիսկերի կառավարումը, ռազմավարությունը և կրթությունը: 4x հաքաթոնի հաղթող և սոցիալական ազդեցություն տվյալների պաշտպանից: Ներկայումս աշխատում է Ֆիլիպիններում AI աշխատուժը վերսկսելու ուղղությամբ: Իմ մասին ավելին իմացեք այստեղ՝ https://docligot.com