Nagsagawa ako kamakailan ng isang klase sa paggamit ng data science para sa cybersecurity, na tumutuon sa pagsusuri ng packet capture data—isang medyo teknikal at tradisyonal na tuyo na paksa. Ang diskarte na ibinahagi ko ay nakuha mula sa aking karanasan sa cybersecurity sa loob ng mga institusyong pampinansyal, na sumasaklaw sa mga pangunahing hakbang tulad ng pagsusuri ng data ng paggalugad, preprocessing at pagbabago ng data ng log, at pagtukoy ng mga anomalya sa pamamagitan ng kumbinasyon ng clustering at graph network analysis.
Ang isang nakakagulat na aspeto ay ang oras na ginugol ko sa paghahanda para sa sesyon na ito—isang bahagi ng karaniwan kong ipinuhunan. Malaki ang naging papel ng AI sa pag-streamline ng proseso. Ginamit ko si Claude para tumulong sa coding, pagbuo ng outline, at kahit sa paggawa ng mga slide. Sa kabuuan, handa na ang buong kurso sa loob ng 48 oras.
Nakakaengganyo pala ang session. Ang mga kalahok, pangunahin ang mga CISO na karaniwang hindi nagko-code, ay natagpuan na ang mga pagsasanay, na ginawa sa tulong ng AI, ay intuitive at hands-on. Ang layunin ko ay isawsaw sila sa direktang pagtatrabaho gamit ang data at code. Lalo nilang pinahahalagahan ang pagkakataong manu-manong tuklasin kung ano ang karaniwang ginagawa ng modernong cyberthreat surveillance at mga platform ng SIEM, na nakakakuha ng mga insight sa mga prosesong nangyayari "sa ilalim ng hood."
Ang aking pangunahing takeaway mula sa klase ay nakakagulat na counterintuitive: ang data science, tulad ng alam natin, ay papalitan ng AI . Ang pananaw na ito ay maaaring mukhang napaaga—o marahil ay mas maaga kaysa sa panahon nito—ngunit ito ay isang pananaw na nangangailangan ng talakayan.
Babala: ang ilan sa mga ito ay maaaring mag-trigger ng mga tao.
Sa loob ng mahigit isang dekada, ang agham ng data ay ipinagdiriwang bilang "pinakaseksing trabaho ng ika-21 siglo." Ngunit habang mabilis na umuunlad ang AI, nagiging malinaw na ang mga pinagbabatayan ng mga hamon sa larangan ay mas mahirap kalimutan. Ang pagdating ng makapangyarihang generative AI ay maaaring maging ang tipping point para sa isang disiplina na, sa pagbabalik-tanaw, ay maaaring mas maluwag na tinukoy at overhyped kaysa sa una na kinikilala.
Sa esensya nito, pinagsasama ng data science ang computer science, statistics, at business acumen, na nag-aalok sa mga organisasyon ng pangako ng mga naaaksyunan na insight mula sa napakaraming data. Ang skillset na ito ay hindi maikakailang mahalaga sa mundong hinihimok ng data ngayon. Gayunpaman, sa ilalim ng makintab na imahe nito, nahaharap ang field ng mga makabuluhang isyu. Ang madalas na binansagan bilang data science ay madalas na lumalabas na isang tagpi-tagping gawain ng mga gawaing hindi palaging magkakaugnay, at maraming mga propesyonal sa larangan ang nakikibaka sa buong lawak at kumplikadong hinihingi ng disiplina.
Ang pagtaas ng mga tool na hinimok ng AI na may kakayahang pangasiwaan ang pagsusuri ng data, pagmomodelo, at pagbuo ng insight ay maaaring magpilit ng pagbabago sa kung paano natin tinitingnan ang papel at hinaharap ng data science mismo. Habang patuloy na pinapasimple at ino-automate ng AI ang marami sa mga pangunahing gawain sa loob ng data science, maaaring harapin ng field ang pagtutuos kung ano talaga ang ibig sabihin ng pagiging data scientist sa edad ng intelligent automation.
Maraming data scientist, sa kabila ng paggamit ng mga sopistikadong kasanayan sa pag-coding at mga digital na tool, ay nakikibahagi sa gawaing nakakagulat na manu-mano at madaling magkamali . Ang paghahanda, paglilinis, at pagsusuri ng data ay nagsasangkot ng nakakapagod, nakakaubos ng oras na mga gawain na paulit-ulit at mekanikal. Sa katunayan, malaking halaga ng data science labor ang napupunta sa paghahanda ng mga dataset—isang gawain na kadalasang parang nakakapagod kaysa sa kapana-panabik, natuklas na agham na ginawa nito. Ang problemang ito ay pinalubha ng katotohanan na marami sa mga pumapasok sa larangan ay, sa pinakamahusay, mga baguhan. Ang pagkuha ng ilang online na kurso sa Python o R, ang mga "data scientist" na ito ay kadalasang hindi handa para sa hirap ng tungkulin . Ang agham ng data ay hindi lamang coding. Kabilang dito ang malalim na pagsusuri, pag-unawa sa konteksto, at kakayahang magpakita ng mga insight sa mga hindi teknikal na madla. Sa totoo lang, ito ay higit pa sa isang pananaliksik na trabaho, na nangangailangan ng isang timpla ng pagkamalikhain at analytical na pag-iisip na hindi taglay ng marami sa larangan.
Higit pa rito, maraming data scientist ang nakabuo ng pakiramdam ng karapatan, umaasa ng mataas na suweldo at kapaki-pakinabang na mga pakete dahil lamang sa kanilang titulo. Ang saloobing ito ay pinapatay ang mga kumpanya, lalo na sa mga sektor kung saan ang kahusayan sa gastos ay higit sa lahat. Nakilala ko ang mga kumpanya na minsan ay nagmamadaling kumuha ng mga data scientist ngunit ngayon ay muling isinasaalang-alang. Bakit magbabayad ng mataas na sahod sa isang taong gumugugol ng halos lahat ng kanilang oras sa pakikipagbuno sa paglilinis ng data, kung magagawa ito ng AI nang mas mabilis, mas mahusay, at sa isang maliit na bahagi ng gastos?
Habang personal kong naranasan ang pagsusulat ng klase, ang Generative AI ay naging isang malakas na puwersa sa mismong mga lugar kung saan pinakamahina ang data science. Ang mga gawain tulad ng paghahanda ng data, paglilinis, at maging ang pangunahing pagsusuri ng husay—mga aktibidad na kumukonsumo ng maraming oras ng data scientist—ay madali nang na-automate ng mga AI system . Ang mas masahol pa (o mas mabuti, depende sa kung saan ka nakatayo) ay ang AI ay mas mabilis, mas tumpak, at mas madaling kapitan ng pagkakamali ng tao o pagkapagod.
Para sa maraming data scientist, maaaring nakakatakot ito. Pagkatapos ng lahat, ang mga gawaing ito ay kumakatawan sa karamihan ng kanilang pang-araw-araw na gawain. Ang paglilinis ng data, halimbawa, ay kilalang-kilala na nakakaubos ng oras at madaling kapitan ng mga pagkakamali, ngunit magagawa na ito ng AI sa ilang mga pag-click at malapit sa perpektong katumpakan. Ang mga data scientist ay madalas na nagrereklamo tungkol sa mga gawaing ito ng ungol, ngunit mahalaga ang mga ito sa kanilang mga tungkulin. Habang umuunlad ang mga AI system, nababawasan ang pangangailangan ng mga tao na gawin ang mga trabahong ito. Hindi nakakagulat na ang karamihan sa vocal criticism laban sa AI ay mula mismo sa mga data scientist . Nakikita nila ang nakasulat sa dingding at natatakot sa kanilang mga trabaho.
Upang palalain ang mga bagay para sa mga data scientist, ang field ay hindi gumawa ng makabuluhang pag-unlad sa mga nakaraang taon. Sa kabila ng napakabilis na pagtaas nito sa katanyagan, ang agham ng data ay sinasaktan pa rin ng mga kawalan ng kahusayan, mga pagkakamali, at kakulangan ng kalinawan sa kung ano ang eksaktong dapat na kasama nito . Ito ay dating pinaniniwalaan na ang mas sopistikadong mga tool at mas mahusay na pagsasanay ay magbabago sa larangan, ngunit ito ay hindi natupad sa lawak na inaasahan. Sa kabaligtaran, ang AI ay patuloy na bumuti. Mabilis na umuunlad ang mga algorithm sa pag-aaral ng machine, natural na pagpoproseso ng wika, at mga generative na modelo, na nag-iiwan sa tradisyunal na data science sa alikabok.
Muli, ang mataas na mga inaasahan sa suweldo ng mga data scientist ay pinagsama ang isyu . Napagtatanto na ngayon ng mga kumpanyang dati nang pinahintulutan ang mga inefficiencies na maaaring palitan ng AI ang maraming gawaing ungol nang walang mabigat na tag ng presyo na nakakabit sa paggawa ng tao. Sa pagiging mas dalubhasa ng AI sa pagsasagawa ng mga pangunahing gawain tulad ng pagsusuri, pagtataya, at kahit na pagtatanghal, ang manual na katangian ng data science ay lalong nagiging redundant. Matatanto ng maraming kumpanya na ang dati ay nangangailangan ng isang pangkat ng mga data scientist ay maaari na ngayong pangasiwaan nang mas mahusay ng mga tool na pinapagana ng AI.
Ang katotohanan ay ang data science, gaya ng tradisyonal na tinukoy, ay nasa bingit ng pagkaluma. Sa pagsulong ng generative AI sa isang kahanga-hangang bilis, malamang na bababa ang pangangailangan para sa mga siyentipiko ng data ng tao sa kanilang kasalukuyang anyo . Hindi ito nagpapahiwatig na ang mga tao ay walang papel sa data-driven na paggawa ng desisyon, ngunit ang klasikong papel na "data scientist" ay maaaring maging isang konsepto ng nakaraan. Ang kailangan ngayon ay ang mga propesyonal na bihasa sa pakikipagtulungan sa AI, na ginagamit ang mga kakayahan nito habang nakatuon sa madiskarteng pag-iisip at kumplikadong paglutas ng problema sa mas mataas na antas.
Ang AI ay hindi ang dulo ng analytics, mga insight, o paggawa ng desisyon—kinakatawan nito ang kanilang ebolusyon . Ang kasalukuyang larangan ng data science ay nanganganib na maging lipas na kung hindi ito uunlad sa hakbang. Binabago na ng AI ang mga industriya, at dapat na umangkop ang agham ng data o may panganib na maabutan ng alon na ito. Sa huli, ang tanong ay maaaring hindi kung aalisin ng AI ang data science ngunit kung ang data science ay ganap na naihatid sa mga pangako nito.
O marahil ang pagkakaiba ay hindi mahalaga kung sa wakas ay lumipat tayo sa kabila ng hype ng "data science" at yakapin ang AI bilang susunod na lohikal na pag-unlad.
Tungkol sa Akin: 25+ taong IT beterano na pinagsasama-sama ang data, AI, pamamahala sa peligro, diskarte, at edukasyon. 4x hackathon winner at social impact mula sa data advocate. Kasalukuyang nagtatrabaho upang simulan ang AI workforce sa Pilipinas. Matuto pa tungkol sa akin dito: https://docligot.com