Technologist, Social Impact, Data Ethics, AI
The is an opinion piece based on the author’s POV and does not necessarily reflect the views of HackerNoon.
Վերջերս ես անցկացրեցի դաս կիբերանվտանգության համար տվյալների գիտության օգտագործման վերաբերյալ՝ կենտրոնանալով փաթեթների հավաքագրման տվյալների վերլուծության վրա՝ որոշակիորեն տեխնիկական և ավանդաբար չոր թեմա: Մոտեցումը, որը ես կիսեցի, բխում էր ֆինանսական հաստատությունների ներսում կիբերանվտանգության իմ փորձից՝ ընդգրկելով հիմնական քայլերը, ինչպիսիք են հետազոտական տվյալների վերլուծությունը, նախնական մշակումը և վերափոխումը գրանցամատյանների տվյալների, ինչպես նաև անոմալիաների բացահայտումը կլաստերի և գրաֆիկական ցանցի վերլուծության միջոցով:
Զարմանալի ասպեկտներից մեկն այն ժամանակն էր, որը ես ծախսեցի այս նստաշրջանին պատրաստվելու համար՝ մի փոքր մասն այն ամենի, ինչ ես սովորաբար ներդնում էի: AI-ն նշանակալի դեր է խաղացել գործընթացի պարզեցման գործում: Ես օգտագործեցի Կլոդին կոդավորման, ուրվագիծը մշակելու և նույնիսկ սլայդներ ստեղծելու համար: Ընդհանուր առմամբ, ամբողջ դասընթացը պատրաստ էր 48 ժամվա ընթացքում։
Նիստը գրավիչ ստացվեց. Մասնակիցները, հիմնականում CISO-ները, ովքեր սովորաբար չեն կոդավորում, պարզեցին, որ AI-ի օգնությամբ ստեղծված վարժությունները ինտուիտիվ և գործնական են: Իմ նպատակն էր ընկղմել նրանց ուղղակիորեն տվյալների և կոդի հետ աշխատելու մեջ: Նրանք հատկապես գնահատեցին ձեռքով ուսումնասիրելու հնարավորությունը, թե ժամանակակից կիբերսպառնալիքների հսկողությունը և SIEM հարթակները սովորաբար ավտոմատացնում են՝ ստանալով պատկերացումներ այն գործընթացների մասին, որոնք տեղի են ունենում «գլխարկի տակ»:
Դասից իմ հիմնական կետը զարմանալիորեն հակասական էր. տվյալների գիտությունը, ինչպես մենք գիտենք, ի վերջո կփոխարինվի AI-ով : Այս տեսակետը կարող է թվալ վաղաժամ, կամ գուցե իր ժամանակից շուտ, բայց դա մի հեռանկար է, որը պահանջում է քննարկում:
Զգուշացում. դրանցից մի քանիսը կարող են առաջացնել մարդկանց:
Ավելի քան մեկ տասնամյակ տվյալների գիտությունը նշվում է որպես «21-րդ դարի ամենասեքսուալ աշխատանքը»: Այնուամենայնիվ, երբ AI-ն արագորեն զարգանում է, պարզ է դառնում, որ ոլորտի հիմքում ընկած մարտահրավերներն ավելի դժվար է անտեսել: Հզոր գեներատիվ արհեստական ինտելեկտի հայտնվելը շատ լավ կարող է հանգուցային կետ լինել մի կարգապահության համար, որը, հետահայաց հայացքով, կարող էր ավելի թույլ սահմանվել և գերագնահատված լինել, քան ի սկզբանե ընդունվել էր:
Իր էությամբ տվյալների գիտությունը միավորում է համակարգչային գիտությունը, վիճակագրությունը և բիզնեսի խորաթափանցությունը՝ կազմակերպություններին առաջարկելով հսկայական քանակությամբ տվյալների գործնական պատկերացումների խոստում: Այս հմտությունների հավաքածուն անհերքելիորեն արժեքավոր է այսօրվա տվյալների վրա հիմնված աշխարհում: Այնուամենայնիվ, իր հղկված պատկերի տակ դաշտը բախվում է էական խնդիրների: Այն, ինչ հաճախ պիտակավորվում է որպես տվյալների գիտություն, հաճախ պարզվում է, որ այն անփույթ առնչվող առաջադրանքների կարկատան է, որոնք միշտ չէ, որ կոկիկորեն համընկնում են, և ոլորտի շատ մասնագետներ պայքարում են այն ամբողջ լայնության և բարդության դեմ, որը պահանջում է կարգապահությունը:
AI-ի վրա հիմնված գործիքների աճը, որոնք ունակ են կարգավորել տվյալների վերլուծությունը, մոդելավորումը և պատկերացում ստեղծելը, կարող է ստիպել փոխել այն, թե ինչպես ենք մենք դիտարկում բուն տվյալների գիտության դերն ու ապագան: Քանի որ AI-ն շարունակում է պարզեցնել և ավտոմատացնել տվյալների գիտության մեջ հիմնարար առաջադրանքներից շատերը, ոլորտը կարող է հաշվի առնել, թե իրականում ինչ է նշանակում լինել տվյալների գիտնական խելացի ավտոմատացման դարաշրջանում:
Տվյալների շատ գիտնականներ, չնայած տիրապետում են կոդավորման բարդ հմտություններին և թվային գործիքներին, զբաղվում են աշխատանքի մեջ, որը զարմանալիորեն ձեռքով է և հակված է սխալների : Տվյալների պատրաստումը, մաքրումը և վերլուծությունը ներառում են հոգնեցուցիչ, ժամանակատար առաջադրանքներ, որոնք կրկնվող և մեխանիկական են: Իրականում, տվյալների գիտության աշխատանքի զգալի քանակն ուղղվում է տվյալների շտեմարանների պատրաստմանը, մի խնդիր, որը հաճախ ավելի շատ դժվարություն է թվում, քան հայտնագործությունների վրա հիմնված հետաքրքիր գիտություն: Այս խնդիրը բարդանում է նրանով, որ դաշտ մտնողներից շատերը լավագույն դեպքում սիրողական են: Python-ի կամ R-ի մի քանի առցանց դասընթացներ անցնելով՝ այս «տվյալների գիտնականները» հաճախ պատրաստ չեն դերի խստությանը : Տվյալների գիտությունը պարզապես կոդավորում չէ: Այն ներառում է խորը վերլուծություն, համատեքստային ըմբռնում և ոչ տեխնիկական լսարանին պատկերացումներ ներկայացնելու կարողություն: Իրականում, դա ավելի շատ հետազոտական աշխատանք է, որը պահանջում է ստեղծագործական և վերլուծական մտածողության խառնուրդ, որը ոլորտում շատերը պարզապես չունեն:
Ավելին, տվյալների շատ գիտնականներ զարգացրել են իրավունքի զգացում` ակնկալելով բարձր աշխատավարձեր և շահութաբեր փաթեթներ հենց իրենց կոչման շնորհիվ: Այս վերաբերմունքը խանգարում է ընկերություններին, հատկապես այն ոլորտներում, որտեղ ծախսերի արդյունավետությունը առաջնային է: Ես հանդիպել եմ ընկերությունների, որոնք ժամանակին շտապում էին տվյալների գիտնականներ վարձել, բայց այժմ վերանայում են: Ինչու՞ բարձր աշխատավարձ վճարել մեկին, ով իր ժամանակի մեծ մասը ծախսում է տվյալների մաքրման հետ պայքարում, երբ AI-ն կարող է դա անել ավելի արագ, ավելի լավ և ծախսերի չնչին չափով:
Քանի որ ես անձամբ փորձեցի դասը գրել, Generative AI-ն վերածվել է հզոր ուժի հենց այն ոլորտներում, որտեղ տվյալների գիտությունն ամենաթույլն է: Տվյալների պատրաստումը, մաքրումը և նույնիսկ տարրական որակական վերլուծությունը՝ գործողություններ, որոնք խլում են տվյալների գիտնականի ժամանակի մեծ մասը, այժմ հեշտությամբ ավտոմատացվում են AI համակարգերի կողմից : Ավելի վատն է (կամ ավելի լավը, կախված նրանից, թե որտեղ եք կանգնած) այն է, որ AI-ն ավելի արագ է, ավելի ճշգրիտ և ավելի քիչ հակված մարդկային սխալի կամ հոգնածության:
Տվյալների շատ գիտնականների համար սա կարող է սարսափելի լինել: Ի վերջո, այս առաջադրանքները ներկայացնում են նրանց ամենօրյա աշխատանքի հիմնական մասը: Տվյալների մաքրումը, օրինակ, տխրահռչակ ժամանակատար է և հակված է սխալների, բայց AI-ն այժմ կարող է դա իրականացնել մի քանի կտտոցով և գրեթե կատարյալ ճշգրտությամբ: Տվյալների գիտնականները հաճախ դժգոհում են այս խրթխրթան առաջադրանքներից, սակայն դրանք հիմնարար նշանակություն ունեն իրենց դերի համար: Քանի որ AI համակարգերը բարելավվում են, մարդկանց կողմից այդ աշխատանքները կատարելու անհրաժեշտությունը նվազում է: Զարմանալի չէ, որ AI-ի դեմ հնչեղ քննադատությունների մեծ մասը գալիս է հենց տվյալների գիտնականներից : Նրանք տեսնում են պատի գրությունը և վախենում են իրենց աշխատանքի համար:
Տվյալների գիտնականների համար իրավիճակը ավելի վատթարացնելու համար ոլորտը վերջին տարիներին զգալի առաջընթաց չի գրանցել: Չնայած իր ժողովրդականության մետեորիկ աճին, տվյալների գիտությունը դեռևս տառապում է անարդյունավետությամբ, սխալներով և հստակության պակասով, թե կոնկրետ ինչ պետք է պարունակի այն : Ժամանակին ենթադրվում էր, որ ավելի բարդ գործիքները և ավելի լավ ուսուցումը կզարգացնեն ոլորտը, բայց դա չիրականացավ այնքան, որքան ակնկալվում էր: Ի հակադրություն, AI-ն անշեղորեն բարելավվել է: Մեքենայի ուսուցման ալգորիթմները, բնական լեզվի մշակումը և գեներատիվ մոդելները արագորեն զարգանում են՝ թողնելով ավանդական տվյալների գիտությունը փոշու մեջ:
Կրկին, տվյալների գիտնականների բարձր աշխատավարձի ակնկալիքները բարդացնում են խնդիրը : Ընկերությունները, որոնք ժամանակին կարող էին հանդուրժել անարդյունավետությունը, այժմ հասկանում են, որ արհեստական ինտելեկտը կարող է փոխարինել մեծ թվով ծանր աշխատանք՝ առանց մարդկային աշխատանքին առնչվող ահռելի գնի: Քանի որ AI-ն ավելի հմուտ է դառնում հիմնական առաջադրանքների կատարման մեջ, ինչպիսիք են վերլուծությունը, կանխատեսումը և նույնիսկ ներկայացումը, տվյալների գիտության ձեռքի բնույթը գնալով ավելորդ է դառնում: Շատ ընկերություններ կհասկանան, որ այն, ինչ նախկինում պահանջում էր տվյալների գիտնականների թիմ, այժմ կարող է ավելի արդյունավետ կերպով կարգավորվել արհեստական ինտելեկտի վրա աշխատող գործիքների միջոցով:
Իրականությունն այն է, որ տվյալների գիտությունը, ինչպես ավանդաբար սահմանվում է, գտնվում է հնացման եզրին: Զարմանալի տեմպերով գեներատիվ ինտելեկտուալ ինտելեկտի առաջընթացով, մարդկային տվյալների գիտնականների պահանջարկն իրենց ներկայիս տեսքով, հավանաբար, կնվազի : Սա չի նշանակում, որ մարդիկ որևէ դեր չունեն տվյալների վրա հիմնված որոշումների կայացման գործում, սակայն դասական «տվյալների գիտնական» դերը շուտով կարող է դառնալ անցյալի հայեցակարգ: Այն, ինչ այժմ անհրաժեշտ է, արհեստավարժ ինտելեկտի հետ համագործակցելու հմուտ մասնագետներ են, որոնք կօգտագործեն նրա հնարավորությունները՝ միաժամանակ կենտրոնանալով ռազմավարական մտածողության և ավելի բարձր մակարդակի բարդ խնդիրների լուծման վրա:
AI-ն վերլուծության, պատկերացումների կամ որոշումների կայացման վերջը չէ, այն ներկայացնում է դրանց էվոլյուցիան : Տվյալների գիտության ներկայիս ոլորտը կարող է հնանալ, եթե այն չզարգանա քայլ առ քայլ: AI-ն արդեն իսկ հեղափոխություն է անում արդյունաբերության մեջ, և տվյալների գիտությունը պետք է հարմարվի կամ ռիսկի ենթարկվի այս ալիքի կողմից: Ի վերջո, հարցը կարող է լինել ոչ թե AI-ն կվերացնի տվյալների գիտությունը, այլ արդյոք տվյալների գիտությունը երբևէ ամբողջությամբ կատարել է իր խոստումները:
Կամ գուցե տարբերությունը նույնիսկ նշանակություն չունի, եթե մենք վերջապես դուրս գանք «տվյալների գիտության» հիպից և ընդունենք AI-ն որպես հաջորդ տրամաբանական առաջընթաց:
Իմ մասին. 25+ տարվա ՏՏ վետերան՝ համատեղելով տվյալները, AI, ռիսկերի կառավարումը, ռազմավարությունը և կրթությունը: 4x հաքաթոնի հաղթող և սոցիալական ազդեցություն տվյալների պաշտպանից: Ներկայումս աշխատում է Ֆիլիպիններում AI աշխատուժը վերսկսելու ուղղությամբ: Իմ մասին ավելին իմացեք այստեղ՝ https://docligot.com