Kohët e fundit kam kryer një klasë mbi përdorimin e shkencës së të dhënave për sigurinë kibernetike, duke u fokusuar në analizën e të dhënave të kapjes së paketave - një temë disi teknike dhe tradicionalisht e thatë. Qasja që ndava u nxorr nga përvoja ime në sigurinë kibernetike brenda institucioneve financiare, duke mbuluar hapat thelbësorë si analiza e të dhënave eksploruese, parapërpunimi dhe transformimi i të dhënave të regjistrave dhe identifikimi i anomalive përmes një kombinimi të grupimit dhe analizës së rrjetit grafik.
Një aspekt befasues ishte koha që kalova duke u përgatitur për këtë sesion - një pjesë e asaj që zakonisht investoja. AI luajti një rol të rëndësishëm në thjeshtimin e procesit. Kam përdorur Claude për të ndihmuar me kodimin, zhvillimin e skicës dhe madje edhe krijimin e rrëshqitjeve. Në total, i gjithë kursi ishte gati brenda 48 orëve.
Seanca doli të jetë tërheqëse. Pjesëmarrësit, kryesisht CISO që zakonisht nuk kodojnë, gjetën se ushtrimet, të krijuara me ndihmën e AI, ishin intuitive dhe praktike. Qëllimi im ishte t'i zhysja në punën e drejtpërdrejtë me të dhënat dhe kodin. Ata vlerësuan veçanërisht mundësinë për të eksploruar manualisht atë që mbikqyrja moderne e kërcënimeve kibernetike dhe platformat SIEM zakonisht automatizojnë, duke fituar njohuri mbi proceset që ndodhin "nën kapuç".
Çështja ime kryesore nga klasa ishte çuditërisht kundërintuitive: shkenca e të dhënave, siç e njohim ne, përfundimisht do të zëvendësohet nga AI . Kjo pikëpamje mund të duket e parakohshme - ose ndoshta përpara kohës së saj - por është një perspektivë që kërkon diskutim.
Paralajmërim: disa nga këto mund të shkaktojnë njerëz.
Për më shumë se një dekadë, shkenca e të dhënave është festuar si "puna më seksi e shekullit të 21-të". Megjithatë, ndërsa AI përparon me shpejtësi, po bëhet e qartë se sfidat themelore të fushës janë më të vështira për t'u anashkaluar. Ardhja e inteligjencës artificiale të fuqishme gjeneruese mund të jetë fare mirë pika e kthesës për një disiplinë që, në retrospektivë, mund të ketë qenë më e përkufizuar dhe e mbipopulluar sesa ishte pranuar fillimisht.
Në thelb, shkenca e të dhënave kombinon shkencën kompjuterike, statistikat dhe mendjemprehtësinë e biznesit, duke u ofruar organizatave premtimin e njohurive të zbatueshme nga sasi të mëdha të dhënash. Ky grup aftësish është padyshim i vlefshëm në botën e sotme të drejtuar nga të dhënat. Megjithatë, nën imazhin e saj të lëmuar, fusha përballet me probleme të rëndësishme. Ajo që shpesh etiketohet si shkencë e të dhënave shpesh rezulton të jetë një grumbull detyrash të lidhura lirshëm që nuk përputhen gjithmonë mirë, dhe shumë profesionistë në këtë fushë luftojnë me gjerësinë dhe kompleksitetin e plotë që kërkon disiplina.
Rritja e mjeteve të drejtuara nga AI, të afta për të trajtuar analizën e të dhënave, modelimin dhe gjenerimin e njohurive mund të detyrojë një ndryshim në mënyrën se si ne e shohim rolin dhe të ardhmen e vetë shkencës së të dhënave. Ndërsa AI vazhdon të thjeshtojë dhe automatizojë shumë nga detyrat themelore brenda shkencës së të dhënave, fusha mund të përballet me një llogari se çfarë do të thotë vërtet të jesh një shkencëtar i të dhënave në epokën e automatizimit inteligjent.
Shumë shkencëtarë të të dhënave, pavarësisht se zotërojnë aftësi të sofistikuara kodimi dhe mjete dixhitale, angazhohen në punë që është çuditërisht manuale dhe e prirur për gabime . Përgatitja, pastrimi dhe analiza e të dhënave përfshijnë detyra të lodhshme, që kërkojnë kohë, që janë të përsëritura dhe mekanike. Në fakt, një sasi e konsiderueshme e punës së shkencës së të dhënave shkon në përgatitjen e grupeve të të dhënave - një detyrë që shpesh ndihet më shumë si një punë e mundimshme sesa shkenca emocionuese, e drejtuar nga zbulimet që është bërë. Ky problem shtohet nga fakti se shumë nga ata që hyjnë në fushë janë, në rastin më të mirë, amatorë. Pasi kanë marrë disa kurse online në Python ose R, këta "shkencëtarë të të dhënave" shpesh janë të papërgatitur për ashpërsinë e rolit . Shkenca e të dhënave nuk është vetëm kodim. Ai përfshin analiza të thella, kuptim kontekstual dhe aftësinë për të paraqitur njohuri për audiencën jo-teknike. Në të vërtetë, është më shumë një punë kërkimore, që kërkon një përzierje të kreativitetit dhe të menduarit analitik që shumë në këtë fushë thjesht nuk e posedojnë.
Për më tepër, shumë shkencëtarë të të dhënave kanë zhvilluar një ndjenjë të të drejtës, duke pritur paga të larta dhe paketa fitimprurëse vetëm për shkak të titullit të tyre. Ky qëndrim po i largon kompanitë, veçanërisht në sektorët ku efikasiteti i kostos është parësor. Kam takuar firma që dikur nxituan të punësojnë shkencëtarë të të dhënave, por tani po e rishikojnë. Pse t'i paguani paga të larta dikujt që kalon pjesën më të madhe të kohës duke luftuar me pastrimin e të dhënave, kur AI mund ta bëjë atë më shpejt, më mirë dhe me një fraksion të kostos?
Ndërsa unë personalisht e kam përjetuar shkrimin e klasës, AI gjeneruese ka evoluar në një forcë të fuqishme pikërisht në fushat ku shkenca e të dhënave është më e dobëta. Detyrat si përgatitja e të dhënave, pastrimi dhe madje edhe analiza bazë cilësore - aktivitete që konsumojnë shumë nga koha e një shkencëtari të të dhënave - tani automatizohen lehtësisht nga sistemet e AI . Ajo që është më e keqja (ose më mirë, në varësi të vendit ku qëndroni) është se AI është më i shpejtë, më i saktë dhe më pak i prirur ndaj gabimeve njerëzore ose lodhjes.
Për shumë shkencëtarë të të dhënave, kjo mund të jetë e frikshme. Në fund të fundit, këto detyra përfaqësojnë pjesën më të madhe të punës së tyre të përditshme. Pastrimi i të dhënave, për shembull, kërkon shumë kohë dhe i prirur për gabime, por AI tani mund ta realizojë atë me disa klikime dhe saktësi pothuajse perfekte. Shkencëtarët e të dhënave shpesh ankohen për këto detyra rënkuese, por ato janë thelbësore për rolet e tyre. Ndërsa sistemet e AI përmirësohen, nevoja që njerëzit të bëjnë këto punë zvogëlohet. Nuk është për t'u habitur që shumë nga kritikat e zëshme kundër AI vijnë nga vetë shkencëtarët e të dhënave . Ata shohin shkrimet në mur dhe kanë frikë për punën e tyre.
Për t'i bërë gjërat më keq për shkencëtarët e të dhënave, fusha nuk ka bërë përparim të rëndësishëm vitet e fundit. Pavarësisht rritjes së saj meteorike të popullaritetit, shkenca e të dhënave është ende e rrënuar nga joefikasiteti, gabimet dhe mungesa e qartësisë se çfarë saktësisht duhet të sjellë . Dikur besohej se mjetet më të sofistikuara dhe trajnimi më i mirë do të evoluonin këtë fushë, por kjo nuk është realizuar në masën e pritur. Në të kundërt, AI është përmirësuar në mënyrë të qëndrueshme. Algoritmet e mësimit të makinerisë, përpunimi i gjuhës natyrore dhe modelet gjeneruese po evoluojnë me shpejtësi, duke e lënë shkencën tradicionale të të dhënave në pluhur.
Përsëri, pritshmëritë e larta të pagave të shkencëtarëve të të dhënave komplikojnë çështjen . Kompanitë që dikur mund të kishin toleruar joefikasitet, tani po kuptojnë se AI mund të zëvendësojë një pjesë të madhe të punës së zhurmshme pa çmimin e lartë që i bashkëngjitet punës njerëzore. Me AI duke u bërë më e aftë në kryerjen e detyrave kryesore si analiza, parashikimi dhe madje edhe prezantimi, natyra manuale e shkencës së të dhënave po bëhet gjithnjë e më e tepërt. Shumë kompani do të kuptojnë se ajo që dikur kërkonte një ekip shkencëtarësh të të dhënave tani mund të trajtohet në mënyrë më efikase nga mjetet e fuqizuara nga AI.
Realiteti është se shkenca e të dhënave, siç përcaktohet tradicionalisht, është në prag të vjetërsimit. Me AI gjeneruese që përparon me një ritëm mahnitës, kërkesa për shkencëtarë të të dhënave njerëzore në formën e tyre aktuale ka të ngjarë të bjerë . Kjo nuk do të thotë se njerëzit nuk kanë asnjë rol në vendimmarrjen e drejtuar nga të dhënat, por roli klasik i "shkencëtarit të të dhënave" së shpejti mund të jetë një koncept i së kaluarës. Ajo që nevojitet tani janë profesionistë të aftë për të bashkëpunuar me AI, duke shfrytëzuar aftësitë e saj duke u përqendruar në të menduarit strategjik dhe në zgjidhjen komplekse të problemeve në një nivel më të lartë.
Inteligjenca artificiale nuk është fundi i analitikës, njohurive ose vendimmarrjes - ajo përfaqëson evolucionin e tyre . Fusha aktuale e shkencës së të dhënave rrezikon të bëhet e vjetëruar nëse nuk evoluon në hap. AI tashmë po revolucionarizon industritë dhe shkenca e të dhënave duhet të përshtatet ose të rrezikojë të kapërcehet nga kjo valë. Në fund të fundit, pyetja mund të mos jetë nëse AI do të eliminojë shkencën e të dhënave, por nëse shkenca e të dhënave do t'i përmbushë plotësisht premtimet e saj.
Ose ndoshta dallimi nuk ka as rëndësi nëse më në fund shkojmë përtej zhurmës së "shkencës së të dhënave" dhe përqafojmë AI si përparimin tjetër logjik.
Rreth meje: Veteran i IT-së 25+ vjeç që kombinon të dhënat, AI, menaxhimin e rrezikut, strategjinë dhe edukimin. Fituesi i hackathon-it 4x dhe ndikimi social nga avokati i të dhënave. Aktualisht po punohet për të nxitur fuqinë punëtore të AI në Filipine. Mësoni më shumë për mua këtu: https://docligot.com