ახლახან ჩავატარე გაკვეთილი მონაცემთა მეცნიერების გამოყენებაზე კიბერუსაფრთხოებისთვის, ფოკუსირებული იყო პაკეტების დაჭერის მონაცემების ანალიზზე - გარკვეულწილად ტექნიკური და ტრადიციულად მშრალი თემა. მიდგომა, რომელიც მე გავუზიარე, ემყარება ფინანსურ ინსტიტუტებში კიბერუსაფრთხოებაში ჩემს გამოცდილებას, რომელიც მოიცავს ძირითად ეტაპებს, როგორიცაა საძიებო მონაცემთა ანალიზი, წინასწარი დამუშავება და ჟურნალის მონაცემების ტრანსფორმაცია და ანომალიების იდენტიფიცირება კლასტერიზაციისა და გრაფიკული ქსელის ანალიზის კომბინაციით.
ერთი გასაოცარი ასპექტი იყო დრო, რომელიც გავატარე ამ სესიისთვის მოსამზადებლად - იმის მცირე ნაწილი, რასაც ჩვეულებრივ ვაკეთებდი. AI-მ მნიშვნელოვანი როლი ითამაშა პროცესის გამარტივებაში. მე გამოვიყენე კლოდი კოდირების, მონახაზის შემუშავებაში და სლაიდების შესაქმნელად დასახმარებლად. მთლიანობაში, მთელი კურსი მზად იყო 48 საათში.
სხდომა საინტერესო გამოდგა. მონაწილეებმა, უპირველეს ყოვლისა, CISO-ებმა, რომლებიც ჩვეულებრივ არ ახდენენ კოდირებას, თვლიდნენ, რომ სავარჯიშოები, რომლებიც შემუშავებულია ხელოვნური ინტელექტის დახმარებით, იყო ინტუიციური და პრაქტიკული. ჩემი მიზანი იყო მათი ჩაძირვა უშუალოდ მონაცემებთან და კოდებთან მუშაობაში. მათ განსაკუთრებით დააფასეს შანსი, ხელით შეესწავლათ, თუ რას ავტომატიზირებს თანამედროვე კიბერსაფრთხის მეთვალყურეობა და SIEM პლატფორმები, რათა მიიღონ ინფორმაცია იმ პროცესების შესახებ, რომლებიც ხდება „ქუდის ქვეშ“.
გაკვეთილიდან ჩემი მთავარი წანამძღვარი იყო გასაოცრად საწინააღმდეგო: მონაცემთა მეცნიერება, როგორც ჩვენ ვიცით, საბოლოოდ შეიცვლება AI-ით . ეს თვალსაზრისი შეიძლება ნაადრევად მოგეჩვენოთ - ან შესაძლოა თავის დროზე ადრე - მაგრამ ეს არის პერსპექტივა, რომელიც ითხოვს განხილვას.
გაფრთხილება: ზოგიერთმა ამან შეიძლება გამოიწვიოს ადამიანები.
ათწლეულზე მეტი ხნის განმავლობაში, მონაცემთა მეცნიერება აღინიშნა, როგორც "21-ე საუკუნის ყველაზე სექსუალური სამუშაო". მიუხედავად ამისა, რაც AI სწრაფად მიიწევს წინ, ცხადი ხდება, რომ სფეროს ძირითადი გამოწვევები უფრო რთულია შეუმჩნეველი. ძლიერი გენერაციული ხელოვნური ინტელექტის გაჩენა შეიძლება იყოს გარდამტეხი წერტილი დისციპლინისთვის, რომელიც, რეტროსპექტივაში, შესაძლოა უფრო თავისუფლად იყო განსაზღვრული და ზედმეტად გაჟღენთილი, ვიდრე თავდაპირველად იყო აღიარებული.
თავისი არსით, მონაცემთა მეცნიერება აერთიანებს კომპიუტერულ მეცნიერებას, სტატისტიკას და ბიზნესის უნარს, სთავაზობს ორგანიზაციებს დაპირებას, რომ მიაღწიონ ქმედით ინფორმაციას დიდი რაოდენობით მონაცემებიდან. ეს უნარების ნაკრები უდავოდ ღირებულია დღევანდელ მონაცემებზე ორიენტირებულ სამყაროში. თუმცა, მისი გაპრიალებული გამოსახულების მიღმა, დარგს მნიშვნელოვანი პრობლემები აწყდება. ის, რასაც ხშირად მონაცემთა მეცნიერების იარლიყს უწოდებენ, ხშირად აღმოჩნდება, რომ არის ცალმხრივად დაკავშირებული ამოცანების ერთობლიობა, რომლებიც ყოველთვის არ ემთხვევა ერთმანეთს და დარგის ბევრი პროფესიონალი ებრძვის დისციპლინის სრულ სიგანეს და სირთულეს.
AI-ზე ორიენტირებული ხელსაწყოების ზრდამ, რომლებსაც შეუძლიათ მონაცემთა ანალიზის, მოდელირებისა და ინსაიტის წარმოქმნის უნარი, შეიძლება აიძულოს ცვლილება იმაზე, თუ როგორ ვუყურებთ თავად მონაცემთა მეცნიერების როლსა და მომავალს. ვინაიდან ხელოვნური ინტელექტი აგრძელებს მონაცემთა მეცნიერების მრავალი ძირითადი ამოცანის გამარტივებას და ავტომატიზაციას, დარგს შეიძლება შეექმნას გათვალისწინება, თუ რას ნიშნავს იყო იყო მონაცემთა მეცნიერი ინტელექტუალური ავტომატიზაციის ეპოქაში.
ბევრი მონაცემთა მეცნიერი, მიუხედავად კოდირების დახვეწილი უნარებისა და ციფრული ხელსაწყოების გამოყენებისა, ეწევა სამუშაოს, რომელიც საოცრად სახელმძღვანელოა და მიდრეკილია შეცდომებისკენ . მონაცემთა მომზადება, გაწმენდა და ანალიზი მოიცავს დამღლელი, შრომატევადი ამოცანები, რომლებიც განმეორებადი და მექანიკურია. ფაქტობრივად, მონაცემთა მეცნიერების შრომის მნიშვნელოვანი რაოდენობა იხარჯება მონაცემთა ნაკრების მომზადებაში - ამოცანა, რომელიც ხშირად უფრო შრომისმოყვარეობას ჰგავს, ვიდრე საინტერესო, აღმოჩენებზე ორიენტირებული მეცნიერება, როგორც ჩანს. ამ პრობლემას ემატება ისიც, რომ ბევრი ვინც შემოდის ამ სფეროში, საუკეთესო შემთხვევაში, მოყვარულია. Python-ის ან R-ის რამდენიმე ონლაინ კურსის გავლის შემდეგ, ეს „მონაცემთა მეცნიერები“ ხშირად მოუმზადებლები არიან როლის სიმძიმისთვის . მონაცემთა მეცნიერება არ არის მხოლოდ კოდირება. იგი მოიცავს ღრმა ანალიზს, კონტექსტუალურ გაგებას და არატექნიკურ აუდიტორიას შეხედულებების წარდგენის უნარს. სინამდვილეში, ეს უფრო კვლევითი სამუშაოა, რომელიც მოითხოვს კრეატიულობისა და ანალიტიკური აზროვნების შერწყმას, რომელსაც ამ სფეროში ბევრი უბრალოდ არ ფლობს.
გარდა ამისა, მონაცემთა ბევრ მეცნიერს განუვითარდა უფლებამოსილების გრძნობა, ელოდება მაღალ ხელფასს და მომგებიან პაკეტებს მხოლოდ მათი წოდების მიხედვით. ეს დამოკიდებულება აფერხებს კომპანიებს, განსაკუთრებით იმ სექტორებში, სადაც ხარჯების ეფექტურობა უმნიშვნელოვანესია. მე შევხვდი ფირმებს, რომლებიც ოდესღაც ჩქარობდნენ მონაცემთა მეცნიერების დაქირავებას, მაგრამ ახლა განიხილავენ. რატომ უნდა გადაიხადოთ მაღალი ხელფასები მათ, ვინც დროის უმეტეს ნაწილს მონაცემთა გაწმენდაში ატარებს, როდესაც ხელოვნური ინტელექტი ამას უფრო სწრაფად, უკეთესად და მცირე ღირებულებით ატარებს?
როგორც მე პირადად განვიცდიდი კლასის წერას, გენერაციული AI გადაიქცა ძლიერ ძალად სწორედ იმ სფეროებში, სადაც მონაცემთა მეცნიერება ყველაზე სუსტია. ისეთი ამოცანები, როგორიცაა მონაცემთა მომზადება, გაწმენდა და საბაზისო ხარისხობრივი ანალიზიც კი - აქტივობები, რომლებიც მონაცემთა მეცნიერის დიდ დროს ხარჯავს - ახლა ადვილად ავტომატიზირებულია ხელოვნური ინტელექტის სისტემებით . უარესი (ან უკეთესი, იმისდა მიხედვით, თუ სად დგახართ) არის ის, რომ AI უფრო სწრაფი, ზუსტი და ნაკლებად მიდრეკილია ადამიანური შეცდომისკენ ან დაღლილობისკენ.
მრავალი მონაცემთა მეცნიერისთვის ეს შეიძლება იყოს საშინელი. ყოველივე ამის შემდეგ, ეს ამოცანები წარმოადგენს მათი ყოველდღიური მუშაობის ძირითად ნაწილს. მაგალითად, მონაცემთა გაწმენდა დიდ დროს მოითხოვს და მიდრეკილია შეცდომებისკენ, მაგრამ ხელოვნური ინტელექტი ახლა ამას რამდენიმე დაწკაპუნებით და თითქმის სრულყოფილი სიზუსტით ახორციელებს. მონაცემთა მეცნიერები ხშირად უჩივიან ამ მღელვარე ამოცანებს, მაგრამ ისინი ფუნდამენტურია მათი როლებისთვის. ხელოვნური ინტელექტის სისტემების გაუმჯობესებასთან ერთად, ადამიანების მოთხოვნილება ამ სამუშაოს შესრულებაზე მცირდება. გასაკვირი არ არის, რომ ხელოვნური ინტელექტის მიმართ ხმოვანი კრიტიკა თავად მონაცემთა მეცნიერებისგან მოდის . ისინი ხედავენ კედელზე წარწერას და ეშინიათ სამუშაოს.
მონაცემთა მეცნიერებისთვის საქმეების გაუარესების მიზნით, დარგს ბოლო წლების განმავლობაში მნიშვნელოვანი პროგრესი არ მიუღია. მიუხედავად მისი პოპულარობის მეტეორიული ზრდისა, მონაცემთა მეცნიერებას კვლავ აწუხებს არაეფექტურობა, შეცდომები და სიცხადის ნაკლებობა იმის შესახებ, თუ რა უნდა მოჰყვეს მას . ოდესღაც ითვლებოდა, რომ უფრო დახვეწილი ხელსაწყოები და უკეთესი ტრენინგი განავითარებდა ამ სფეროს, მაგრამ ეს არ განხორციელებულა ისე, როგორც მოსალოდნელი იყო. ამის საპირისპიროდ, AI სტაბილურად გაუმჯობესდა. მანქანათმცოდნეობის ალგორითმები, ბუნებრივი ენის დამუშავება და გენერაციული მოდელები სწრაფად ვითარდება და მონაცემთა ტრადიციული მეცნიერების მტვერში რჩება.
ისევ და ისევ, მონაცემთა მეცნიერების მაღალი ხელფასის მოლოდინები ართულებს საკითხს . კომპანიები, რომლებიც შესაძლოა ოდესღაც მოითმენდნენ არაეფექტურობას, ახლა ხვდებიან, რომ AI-ს შეუძლია შეცვალოს ბევრი წუწუნი ადამიანური შრომის დიდი ფასის გარეშე. როდესაც AI ხდება უფრო კომპეტენტური ძირითადი ამოცანების შესრულებაში, როგორიცაა ანალიზი, პროგნოზირება და პრეზენტაციაც კი, მონაცემთა მეცნიერების სახელმძღვანელო ბუნება სულ უფრო ზედმეტი ხდება. ბევრი კომპანია გააცნობიერებს, რომ ის, რაც ადრე მოითხოვდა მონაცემთა მეცნიერთა გუნდს, ახლა უფრო ეფექტურად შეიძლება დამუშავდეს ხელოვნური ინტელექტის მქონე ხელსაწყოებით.
რეალობა ის არის, რომ მონაცემთა მეცნიერება, როგორც ტრადიციულად არის განსაზღვრული, მოძველების ზღვარზეა. გენერაციული AI განსაცვიფრებელი ტემპით მიიწევს, ადამიანთა მონაცემების მეცნიერებზე მოთხოვნა მათი ამჟამინდელი ფორმით სავარაუდოდ შემცირდება . ეს არ ნიშნავს, რომ ადამიანებს არ აქვთ როლი მონაცემების საფუძველზე გადაწყვეტილების მიღებაში, მაგრამ კლასიკური „მონაცემთა მეცნიერის“ როლი შესაძლოა მალე წარსულის კონცეფცია გახდეს. ახლა საჭიროა AI-თან თანამშრომლობის უნარის მქონე პროფესიონალები, გამოიყენონ მისი შესაძლებლობები სტრატეგიულ აზროვნებაზე და კომპლექსური პრობლემების გადაჭრაზე უფრო მაღალ დონეზე.
AI არ არის ანალიტიკის, შეხედულებების ან გადაწყვეტილების მიღების დასასრული - ის წარმოადგენს მათ ევოლუციას . მონაცემთა მეცნიერების ამჟამინდელი სფერო ემუქრება მოძველებას, თუ ის ეტაპობრივად არ განვითარდება. ხელოვნური ინტელექტი უკვე ახდენს რევოლუციას ინდუსტრიებში და მონაცემთა მეცნიერება უნდა მოერგოს, წინააღმდეგ შემთხვევაში ამ ტალღის გადალახვის რისკი. საბოლოო ჯამში, კითხვა შეიძლება არ იყოს, აღმოფხვრის თუ არა ხელოვნური ინტელექტი მონაცემთა მეცნიერებას, არამედ შეასრულებს თუ არა მონაცემთა მეცნიერებას ოდესმე სრულად დაპირებები.
ან შესაძლოა განსხვავებას არც კი აქვს მნიშვნელობა, თუ ჩვენ საბოლოოდ გადავალთ „მონაცემთა მეცნიერების“ აჟიოტაჟის მიღმა და ავიღოთ ხელოვნური ინტელექტი, როგორც შემდეგი ლოგიკური პროგრესი.
ჩემს შესახებ: 25+ წლის IT ვეტერანი, რომელიც აერთიანებს მონაცემებს, AI, რისკის მენეჯმენტს, სტრატეგიას და განათლებას. 4x ჰაკათონის გამარჯვებული და სოციალური გავლენა მონაცემთა დამცველისგან. ამჟამად ვმუშაობ ფილიპინებში ხელოვნური ინტელექტის მუშახელის გააქტიურებაზე. შეიტყვეთ მეტი ჩემს შესახებ აქ: https://docligot.com