Неодамна спроведов час за користење на науката за податоци за сајбер безбедност, фокусирајќи се на анализата на податоците за снимање пакети - нешто техничка и традиционално сува тема. Пристапот што го споделив потекнува од моето искуство во сајбер-безбедноста во финансиските институции, покривајќи ги основните чекори како истражувачка анализа на податоци, претходна обработка и трансформирање на податоците од дневникот и идентификување на аномалии преку комбинација на кластерирање и анализа на мрежата на графикони.
Еден изненадувачки аспект беше времето што го поминав во подготовка за оваа сесија - дел од она што обично го инвестирав. ВИ одигра значајна улога во рационализацијата на процесот. Го користев Клод за да помогнам со кодирање, развивање на контурите, па дури и создавање на слајдови. Севкупно, целиот курс беше подготвен во рок од 48 часа.
Сесијата се покажа како привлечна. Учесниците, првенствено CISO кои обично не кодираат, открија дека вежбите, изработени со помош на ВИ, се интуитивни и практични. Мојата цел беше да ги потопам во работата директно со податоци и код. Тие особено ја ценеа шансата рачно да истражат што вообичаено автоматизираат модерните платформи за надгледување сајбер закани и SIEM, добивајќи увид во процесите што се случуваат „под капакот“.
Мојата клучна работа од класот беше изненадувачки контраинтуитивна: науката за податоци, како што ја знаеме, на крајот ќе биде заменета со вештачка интелигенција . Овој став може да изгледа прерано - или можеби пред своето време - но тоа е перспектива што бара дискусија.
Предупредување: некои од ова може да ги поттикнат луѓето.
Повеќе од една деценија, науката за податоци се слави како „најсекси работа на 21 век“. Сепак, како што вештачката интелигенција брзо напредува, станува јасно дека основните предизвици на полето се потешко да се занемарат. Доаѓањето на моќната генеративна вештачка интелигенција многу добро може да биде пресвртната точка за дисциплина која, во ретроспектива, можеби била полабаво дефинирана и пренагласена отколку што првично беше признаено.
Во својата суштина, науката за податоци ги комбинира компјутерската наука, статистиката и деловната острина, нудејќи им на организациите ветување за остварливи увиди од огромни количини на податоци. Овој сет на вештини е неспорно вреден во денешниот свет управуван од податоци. Сепак, под неговиот полиран имиџ, полето се соочува со значајни проблеми. Она што често се означува како наука за податоци често излегува дека е крпеница од лабаво поврзани задачи кои не секогаш се усогласуваат уредно, а многу професионалци во областа се борат со целосната широчина и сложеност што ги бара дисциплината.
Подемот на алатките управувани од вештачка интелигенција способни за справување со анализа на податоци, моделирање и генерирање на увид може да предизвика промена во начинот на кој гледаме на улогата и иднината на самата наука за податоци. Бидејќи вештачката интелигенција продолжува да поедноставува и автоматизира многу од основните задачи во рамките на науката за податоци, полето може да се соочи со пресметка за тоа што навистина значи да се биде научник за податоци во ерата на интелигентна автоматизација.
Многу научници за податоци, и покрај тоа што користат софистицирани вештини за кодирање и дигитални алатки, се занимаваат со работа што е изненадувачки рачна и склона кон грешки . Подготовката, чистењето и анализата на податоците вклучуваат мачни задачи кои одземаат многу време, кои се повторуваат и се механички. Всушност, значителен дел од трудот на науката за податоци се вложува во подготовката на збирките на податоци - задача која често се чини повеќе како макотрпна работа отколку како возбудлива наука водена од откритија, како што се чини. Овој проблем се надополнува со фактот дека многумина кои влегуваат на теренот се, во најдобар случај, аматери. Откако поминаа неколку онлајн курсеви за Python или R, овие „научници за податоци“ честопати не се подготвени за строгоста на улогата . Науката за податоци не е само кодирање. Вклучува длабока анализа, контекстуално разбирање и способност да се презентираат увиди на не-техничката публика. Всушност, тоа е повеќе истражувачка работа, која бара спој на креативност и аналитичко размислување што многумина во областа едноставно не го поседуваат.
Понатаму, многу научници за податоци развиле чувство на право, очекувајќи високи плати и профитабилни пакети само врз основа на нивната титула. Овој став ги исклучува компаниите, особено во секторите каде што трошковната ефикасност е најважна. Сретнав фирми кои некогаш брзаа да вработат научници за податоци, но сега повторно размислуваат. Зошто да му плаќате високи плати на некој што го поминува поголемиот дел од своето време борејќи се со чистење на податоци, кога вештачката интелигенција може да го направи тоа побрзо, подобро и со мал дел од трошоците?
Како што јас лично го доживеав пишувањето на часот, Generative AI еволуираше во моќна сила во областите каде што науката за податоци е најслаба. Задачите како подготовка на податоци, чистење, па дури и основна квалитативна анализа - активности кои трошат голем дел од времето на научникот за податоци - сега лесно се автоматизираат од системите за вештачка интелигенција . Она што е полошо (или подобро, во зависност од тоа каде стоите) е што вештачката интелигенција е побрза, попрецизна и помалку склона кон човечка грешка или замор.
За многу научници за податоци, ова може да биде застрашувачко. На крајот на краиштата, овие задачи го претставуваат најголемиот дел од нивната секојдневна работа. Чистењето на податоците, на пример, е познато дека одзема време и е склоно кон грешки, но вештачката интелигенција сега може да го постигне со неколку кликања и речиси совршена прецизност. Научниците за податоци често се жалат на овие громогласни задачи, но сепак тие се основни за нивните улоги. Како што се подобруваат системите за вештачка интелигенција, потребата луѓето да ги извршуваат овие работи се намалува. Не е изненадување што голем дел од гласните критики против вештачката интелигенција доаѓаат од самите научници за податоци . Го гледаат пишувањето на ѕидот и се плашат за својата работа.
За да бидат работите уште полоши за научниците за податоци, полето не постигна значителен напредок во последниве години. И покрај неговиот метеорски пораст на популарноста, науката за податоци сè уште е зафатена со неефикасност, грешки и недостаток на јасност за тоа што точно треба да вклучува . Некогаш се веруваше дека пософистицираните алатки и подобрата обука ќе го развијат полето, но тоа не се оствари во обем што се очекуваше. Спротивно на тоа, вештачката интелигенција постојано се подобрува. Алгоритмите за машинско учење, обработката на природниот јазик и генеративните модели брзо се развиваат, оставајќи ја традиционалната наука за податоци во прашина.
Повторно, високите очекувања за плата на научниците за податоци го комплицираат проблемот . Компаниите кои некогаш можеа да толерираа неефикасност, сега сфаќаат дека вештачката интелигенција може да замени голем дел од гревот без високата цена поврзана со човечкиот труд. Со тоа што вештачката интелигенција станува повешта во извршувањето на клучните задачи како што се анализа, прогнозирање, па дури и презентација, мануелната природа на науката за податоци станува се повеќе излишна. Многу компании ќе сфатат дека она што порано бараше тим од научници за податоци, сега може поефикасно да се ракува со алатки со ВИ.
Реалноста е дека науката за податоци, како што традиционално се дефинира, е на работ на застареност. Со генеративната вештачка интелигенција која напредува со неверојатна брзина, побарувачката за научници за човечки податоци во нивната сегашна форма веројатно ќе се намали . Ова не значи дека луѓето немаат улога во донесувањето одлуки водени од податоци, но класичната улога на „научник за податоци“ наскоро може да биде концепт од минатото. Она што е потребно сега се професионалци вешти да соработуваат со вештачката интелигенција, да ги искористат нејзините способности додека се концентрираат на стратешко размислување и сложено решавање на проблеми на повисоко ниво.
Вештачката интелигенција не е крај на аналитиката, увидот или донесувањето одлуки - таа ја претставува нивната еволуција . Сегашното поле на науката за податоци ризикува да застари ако не се развива во чекор. Вештачката интелигенција веќе ги револуционизира индустриите, а науката за податоци мора да се прилагоди или да ризикува да биде совладана од овој бран. На крајот на краиштата, прашањето можеби не е дали вештачката интелигенција ќе ја елиминира науката за податоци, туку дали науката за податоци некогаш целосно ги исполнила своите ветувања.
Или можеби разликата не е ни важна ако конечно преминеме подалеку од возбудата за „науката за податоци“ и ја прифатиме вештачката интелигенција како следната логична прогресија.
За мене: 25+ годишен ИТ ветеран кој комбинира податоци, вештачка интелигенција, управување со ризик, стратегија и образование. 4x победник на хакатон и социјално влијание од застапникот за податоци. Моментално се работи на скокање на работната сила со вештачка интелигенција на Филипините. Дознајте повеќе за мене овде: https://docligot.com