Недавно сам водио час о коришћењу науке о подацима за сајбер безбедност, фокусирајући се на анализу података о хватању пакета — помало техничка и традиционално сува тема. Приступ који сам поделио заснива се на мом искуству у сајбер безбедности у финансијским институцијама, покривајући кључне кораке као што су истраживачка анализа података, претходна обрада и трансформација података евиденције и идентификација аномалија кроз комбинацију кластеризације и анализе мреже графова.
Један изненађујући аспект било је време које сам провео припремајући се за ову сесију — делић онога што бих обично уложио. АИ је одиграла значајну улогу у рационализацији процеса. Користио сам Клода да ми помогне у кодирању, развоју нацрта, па чак и креирању слајдова. Укупно, цео курс је био спреман у року од 48 сати.
Седница се показала занимљивом. Учесници, првенствено ЦИСО-и који обично не кодирају, открили су да су вежбе, направљене уз помоћ вештачке интелигенције, интуитивне и практичне. Мој циљ је био да их уроним у директан рад са подацима и кодом. Посебно су ценили прилику да ручно истраже шта модерни надзор сајбер претњи и СИЕМ платформе обично аутоматизују, добијајући увид у процесе који се дешавају „испод хаубе“.
Мој кључни закључак из класе био је изненађујуће контраинтуитиван: науку о подацима, какву познајемо, на крају ће заменити АИ . Ово гледиште може изгледати преурањено – или можда испред свог времена – али то је перспектива која захтева дискусију.
Упозорење: нешто од овога може покренути људе.
Више од деценије, наука о подацима се слави као „најсекси посао 21. века“. Ипак, како вештачка интелигенција брзо напредује, постаје јасно да је теже превидети основне изазове у овој области. Појава моћне генеративне вештачке интелигенције могла би да буде прекретница за дисциплину која је, гледајући уназад, можда била лабавије дефинисана и пренаглашена него што је првобитно признато.
У својој суштини, наука о подацима комбинује рачунарство, статистику и пословну способност, нудећи организацијама обећање практичних увида из огромне количине података. Овај скуп вјештина је неоспорно вриједан у данашњем свијету вођеном подацима. Међутим, испод свог углађеног имиџа, поље се суочава са значајним проблемима. Оно што се често означава као наука о подацима често се испостави да је сплет лабаво повезаних задатака који се не усклађују увек уредно, а многи професионалци у овој области боре се са пуном ширином и сложеношћу коју дисциплина захтева.
Пораст алата вођених вештачком интелигенцијом који су способни да руководе анализом података, моделирањем и генерисањем увида могао би да натера промену у начину на који гледамо на улогу и будућност саме науке о подацима. Како АИ наставља да поједностављује и аутоматизује многе од основних задатака у науци о подацима, ова област се може суочити са обрачуном о томе шта заиста значи бити научник података у доба интелигентне аутоматизације.
Многи научници података, упркос поседовању софистицираних вештина кодирања и дигиталних алата, баве се радом који је изненађујуће ручан и подложан грешкама . Припрема података, чишћење и анализа укључују досадне, дуготрајне задатке који се понављају и механички. У ствари, значајна количина рада науке о подацима иде у припрему скупова података — задатак који често више личи на напоран рад него на узбудљиву науку вођену открићима за коју се представља. Овај проблем је отежан чињеницом да су многи који улазе на терен, у најбољем случају, аматери. Пошто су прошли неколико онлајн курсева из Питхон-а или Р-а, ови „научници података“ често нису спремни за строгоћу улоге . Наука о подацима није само кодирање. Укључује дубоку анализу, контекстуално разумевање и способност изношења увида нетехничкој публици. Истина, то је више истраживачки посао, који захтева мешавину креативности и аналитичког размишљања који многи на терену једноставно немају.
Штавише, многи научници података развили су осећај да имају право, очекујући високе плате и уносне пакете само на основу свог звања. Овакав став одбија компаније, посебно у секторима у којима је трошковна ефикасност најважнија. Упознао сам фирме које су некада пожуриле да ангажују научнике за податке, али сада преиспитују. Зашто плаћати високе плате некоме ко проводи већину свог времена борећи се са чишћењем података, када АИ то може да уради брже, боље и уз делић цене?
Како сам лично искусио писање часа, генеративна АИ је еволуирала у моћну силу управо у областима у којима је наука о подацима најслабија. Задаци као што су припрема података, чишћење, па чак и основна квалитативна анализа — активности које одузимају много времена научника података — сада лако аутоматизују системи вештачке интелигенције . Оно што је још горе (или боље, у зависности од тога где стојите) је то што је АИ бржа, прецизнија и мање склона људским грешкама или умору.
За многе научнике, ово може бити застрашујуће. На крају крајева, ови задаци представљају највећи део њиховог свакодневног рада. Чишћење података, на пример, је познато дуготрајно и склоно грешкама, али АИ сада то може да постигне са неколико кликова и скоро савршеном прецизношћу. Научници за податке се често жале на ове тешке задатке, али они су од суштинског значаја за њихове улоге. Како се системи вештачке интелигенције побољшавају, потреба за људима да раде ове послове опада. Није изненађење да велики део гласних критика против вештачке интелигенције долази од самих научника података . Они виде натпис на зиду и страхују за свој посао.
Да ствар буде гора за научнике података, ова област није направила значајан напредак последњих година. Упркос великом порасту популарности, науку о подацима још увек муче неефикасност, грешке и недостатак јасноће о томе шта би тачно требало да подразумева . Некада се веровало да ће софистициранији алати и боља обука развити ово поље, али то се није остварило у очекиваној мери. Насупрот томе, АИ се стално побољшава. Алгоритми машинског учења, обрада природног језика и генеративни модели брзо се развијају, остављајући традиционалну науку о подацима у прашини.
Опет, висока очекивања плата научника података отежавају проблем . Компаније које су некада толерисале неефикасност сада схватају да вештачка интелигенција може да замени велики део напорног рада без велике цене која се везује за људски рад. Како АИ постаје све вештија у обављању кључних задатака као што су анализа, предвиђање, па чак и презентација, ручна природа науке о подацима постаје све сувишнија. Многе компаније ће схватити да оно што је некада захтевало тим научника за податке сада може бити ефикасније руковано помоћу алата са АИ.
Реалност је да је наука о подацима, како је традиционално дефинисана, на ивици застарелости. Уз напредовање генеративне вештачке интелигенције невероватном брзином, потражња за научницима људских података у њиховом тренутном облику ће вероватно пасти . Ово не значи да људи немају улогу у доношењу одлука заснованих на подацима, али класична улога „научника података“ ускоро би могла бити концепт прошлости. Оно што је сада потребно јесу професионалци вешти у сарадњи са вештачком интелигенцијом, искориштавањем њених способности док се концентришу на стратешко размишљање и сложено решавање проблема на вишем нивоу.
АИ није крај аналитике, увида или доношења одлука – она представља њихову еволуцију . Садашња област науке о подацима ризикује да застари ако се не развија у корак. АИ већ револуционише индустрије, а наука о подацима мора да се прилагоди или ризикује да буде захваћена овим таласом. На крају, питање можда није да ли ће АИ елиминисати науку о подацима, већ да ли је наука о подацима икада у потпуности испунила своја обећања.
Или можда разлика није ни важна ако коначно одемо даље од „науке о подацима“ и прихватимо АИ као следећу логичку прогресију.
О мени: 25+ година ИТ ветеран који комбинује податке, вештачку интелигенцију, управљање ризиком, стратегију и образовање. 4к победник хакатона и друштвени утицај заговорника података. Тренутно ради на покретању АИ радне снаге на Филипинима. Сазнајте више о мени овде: хттпс://доцлигот.цом