Πρόσφατα διεξήγαγα ένα μάθημα σχετικά με τη χρήση της επιστήμης δεδομένων για την ασφάλεια στον κυβερνοχώρο, εστιάζοντας στην ανάλυση των δεδομένων συλλογής πακέτων - ένα κάπως τεχνικό και παραδοσιακά στεγνό θέμα. Η προσέγγιση που μοιράστηκα προήλθε από την εμπειρία μου στην κυβερνοασφάλεια εντός των χρηματοπιστωτικών ιδρυμάτων, καλύπτοντας βασικά βήματα όπως η διερευνητική ανάλυση δεδομένων, η προεπεξεργασία και ο μετασχηματισμός δεδομένων καταγραφής και ο εντοπισμός ανωμαλιών μέσω ενός συνδυασμού ομαδοποίησης και ανάλυσης δικτύου γραφημάτων.
Μια παράξενη πτυχή ήταν ο χρόνος που αφιέρωσα στην προετοιμασία για αυτήν τη συνεδρία—ένα κλάσμα αυτού που επένδυα συνήθως. Η τεχνητή νοημοσύνη έπαιξε σημαντικό ρόλο στον εξορθολογισμό της διαδικασίας. Χρησιμοποίησα τον Claude για να βοηθήσω με την κωδικοποίηση, την ανάπτυξη του περιγράμματος και ακόμη και τη δημιουργία των διαφανειών. Συνολικά, ολόκληρο το μάθημα ήταν έτοιμο μέσα σε 48 ώρες.
Η συνεδρία αποδείχθηκε συναρπαστική. Οι συμμετέχοντες, κυρίως CISO που συνήθως δεν κωδικοποιούν, βρήκαν ότι οι ασκήσεις, που δημιουργήθηκαν με τη βοήθεια της τεχνητής νοημοσύνης, ήταν διαισθητικές και πρακτικές. Ο στόχος μου ήταν να τους βυθίσω στην απευθείας εργασία με δεδομένα και κώδικα. Εκτίμησαν ιδιαίτερα την ευκαιρία να εξερευνήσουν χειροκίνητα τι αυτοματοποιούν συνήθως οι σύγχρονες πλατφόρμες παρακολούθησης απειλών στον κυβερνοχώρο και οι πλατφόρμες SIEM, αποκτώντας πληροφορίες για τις διαδικασίες που συμβαίνουν "κάτω από το καπό".
Το βασικό μου στοιχείο από το μάθημα ήταν εκπληκτικά αδιανόητο: η επιστήμη των δεδομένων, όπως την ξέρουμε, θα αντικατασταθεί τελικά από την τεχνητή νοημοσύνη . Αυτή η άποψη μπορεί να φαίνεται πρόωρη - ή ίσως μπροστά από την εποχή της - αλλά είναι μια προοπτική που απαιτεί συζήτηση.
Προειδοποίηση: κάποια από αυτά μπορεί να προκαλέσει άτομα.
Για πάνω από μια δεκαετία, η επιστήμη δεδομένων φημίζεται ως η «πιο σέξι δουλειά του 21ου αιώνα». Ωστόσο, καθώς η τεχνητή νοημοσύνη προχωρά γρήγορα, γίνεται σαφές ότι οι υποκείμενες προκλήσεις του τομέα είναι πιο δύσκολο να παραβλεφθούν. Η έλευση της ισχυρής γενετικής τεχνητής νοημοσύνης θα μπορούσε κάλλιστα να είναι το σημείο καμπής για μια πειθαρχία που, εκ των υστέρων, μπορεί να είχε οριστεί πιο χαλαρά και υπερβολικά διατυπωμένη από ό,τι αρχικά είχε αναγνωριστεί.
Στην ουσία, η επιστήμη των δεδομένων συνδυάζει την επιστήμη των υπολογιστών, τις στατιστικές και την επιχειρηματική οξυδέρκεια, προσφέροντας στους οργανισμούς την υπόσχεση για αξιόπιστες πληροφορίες από τεράστιες ποσότητες δεδομένων. Αυτό το σύνολο δεξιοτήτων είναι αναμφισβήτητα πολύτιμο στον σημερινό κόσμο που βασίζεται στα δεδομένα. Ωστόσο, κάτω από τη στιλβωμένη εικόνα του, το πεδίο αντιμετωπίζει σημαντικά ζητήματα. Αυτό που συχνά χαρακτηρίζεται ως επιστήμη δεδομένων συχνά αποδεικνύεται ότι είναι ένα συνονθύλευμα χαλαρά σχετικών εργασιών που δεν ευθυγραμμίζονται πάντα σωστά και πολλοί επαγγελματίες του κλάδου αγωνίζονται με το πλήρες εύρος και την πολυπλοκότητα που απαιτεί ο κλάδος.
Η άνοδος των εργαλείων που βασίζονται στην τεχνητή νοημοσύνη ικανών να χειρίζονται την ανάλυση δεδομένων, τη μοντελοποίηση και τη δημιουργία πληροφοριών θα μπορούσε να επιβάλει μια αλλαγή στον τρόπο με τον οποίο βλέπουμε τον ρόλο και το μέλλον της ίδιας της επιστήμης δεδομένων. Καθώς η τεχνητή νοημοσύνη συνεχίζει να απλοποιεί και να αυτοματοποιεί πολλές από τις θεμελιώδεις εργασίες της επιστήμης δεδομένων, ο τομέας μπορεί να αντιμετωπίσει μια εκτίμηση για το τι σημαίνει πραγματικά να είσαι επιστήμονας δεδομένων στην εποχή του ευφυούς αυτοματισμού.
Πολλοί επιστήμονες δεδομένων, παρά το γεγονός ότι διαθέτουν εξελιγμένες δεξιότητες κωδικοποίησης και ψηφιακά εργαλεία, επιδίδονται σε εργασία που είναι εκπληκτικά χειρωνακτική και επιρρεπής σε σφάλματα . Η προετοιμασία, ο καθαρισμός και η ανάλυση δεδομένων περιλαμβάνουν κουραστικές, χρονοβόρες εργασίες που είναι επαναλαμβανόμενες και μηχανικές. Στην πραγματικότητα, ένας σημαντικός όγκος εργασίας της επιστήμης δεδομένων καταναλώνεται για την προετοιμασία συνόλων δεδομένων - μια εργασία που συχνά μοιάζει περισσότερο με κοπιαστική εργασία παρά ως συναρπαστική επιστήμη που βασίζεται στην ανακάλυψη. Αυτό το πρόβλημα επιδεινώνεται από το γεγονός ότι πολλοί που μπαίνουν στο γήπεδο είναι, στην καλύτερη περίπτωση, ερασιτέχνες. Έχοντας παρακολουθήσει μερικά διαδικτυακά μαθήματα Python ή R, αυτοί οι «επιστήμονες δεδομένων» είναι συχνά απροετοίμαστοι για τις ακραίες καταστάσεις του ρόλου . Η επιστήμη των δεδομένων δεν είναι απλώς κωδικοποίηση. Περιλαμβάνει βαθιά ανάλυση, κατανόηση των συμφραζομένων και την ικανότητα παρουσίασης πληροφοριών σε μη τεχνικό κοινό. Στην πραγματικότητα, είναι περισσότερο μια ερευνητική δουλειά, που απαιτεί ένα μείγμα δημιουργικότητας και αναλυτικής σκέψης που πολλοί στον τομέα απλά δεν διαθέτουν.
Επιπλέον, πολλοί επιστήμονες δεδομένων έχουν αναπτύξει την αίσθηση του δικαιώματος, αναμένοντας υψηλούς μισθούς και προσοδοφόρα πακέτα μόνο λόγω του τίτλου τους. Αυτή η στάση απομακρύνει τις εταιρείες, ειδικά σε τομείς όπου η αποδοτικότητα κόστους είναι πρωταρχικής σημασίας. Έχω συναντήσει εταιρείες που κάποτε έσπευσαν να προσλάβουν επιστήμονες δεδομένων, αλλά τώρα το ξανασκέφτονται. Γιατί να πληρώνετε υψηλούς μισθούς σε κάποιον που ξοδεύει τον περισσότερο χρόνο του παλεύοντας με τον καθαρισμό δεδομένων, όταν η τεχνητή νοημοσύνη μπορεί να το κάνει πιο γρήγορα, καλύτερα και με ένα κλάσμα του κόστους;
Καθώς βίωσα προσωπικά τη συγγραφή της τάξης, το Generative AI έχει εξελιχθεί σε μια ισχυρή δύναμη στους ίδιους τομείς όπου η επιστήμη δεδομένων είναι πιο αδύναμη. Εργασίες όπως η προετοιμασία δεδομένων, ο καθαρισμός, ακόμη και η βασική ποιοτική ανάλυση —δραστηριότητες που καταναλώνουν μεγάλο μέρος του χρόνου ενός επιστήμονα δεδομένων— αυτοματοποιούνται πλέον εύκολα από συστήματα τεχνητής νοημοσύνης . Το χειρότερο (ή καλύτερο, ανάλογα με το πού βρίσκεστε) είναι ότι η τεχνητή νοημοσύνη είναι ταχύτερη, πιο ακριβής και λιγότερο επιρρεπής σε ανθρώπινο λάθος ή κόπωση.
Για πολλούς επιστήμονες δεδομένων, αυτό μπορεί να είναι τρομακτικό. Εξάλλου, αυτές οι εργασίες αντιπροσωπεύουν το μεγαλύτερο μέρος της καθημερινής εργασίας τους. Ο καθαρισμός δεδομένων, για παράδειγμα, είναι εμφανώς χρονοβόρος και επιρρεπής σε λάθη, αλλά η τεχνητή νοημοσύνη μπορεί τώρα να το επιτύχει με λίγα κλικ και σχεδόν τέλεια ακρίβεια. Οι επιστήμονες δεδομένων συχνά παραπονιούνται για αυτά τα γρύλισμα καθήκοντα, ωστόσο είναι θεμελιώδεις για τους ρόλους τους. Καθώς τα συστήματα τεχνητής νοημοσύνης βελτιώνονται, η ανάγκη των ανθρώπων να κάνουν αυτές τις δουλειές μειώνεται. Δεν αποτελεί έκπληξη το γεγονός ότι μεγάλο μέρος της φωνητικής κριτικής κατά της τεχνητής νοημοσύνης προέρχεται από τους ίδιους τους επιστήμονες δεδομένων . Βλέπουν τα γραπτά στον τοίχο και φοβούνται για τη δουλειά τους.
Για να κάνουν τα πράγματα χειρότερα για τους επιστήμονες δεδομένων, ο τομέας δεν έχει σημειώσει σημαντική πρόοδο τα τελευταία χρόνια. Παρά τη μετέωρη άνοδο της δημοτικότητάς της, η επιστήμη δεδομένων εξακολουθεί να μαστίζεται από αναποτελεσματικότητα, λάθη και έλλειψη σαφήνειας σχετικά με το τι ακριβώς πρέπει να συνεπάγεται . Κάποτε πίστευαν ότι πιο εξελιγμένα εργαλεία και καλύτερη εκπαίδευση θα εξελίσσονταν στον τομέα, αλλά αυτό δεν υλοποιήθηκε στον αναμενόμενο βαθμό. Αντίθετα, η τεχνητή νοημοσύνη έχει βελτιωθεί σταθερά. Οι αλγόριθμοι μηχανικής μάθησης, η επεξεργασία φυσικής γλώσσας και τα παραγωγικά μοντέλα εξελίσσονται γρήγορα, αφήνοντας την παραδοσιακή επιστήμη δεδομένων στη σκόνη.
Και πάλι, οι υψηλές μισθολογικές προσδοκίες των επιστημόνων δεδομένων επιδεινώνουν το ζήτημα . Οι εταιρείες που μπορεί κάποτε να ανέχονταν την αναποτελεσματικότητα, συνειδητοποιούν τώρα ότι η τεχνητή νοημοσύνη μπορεί να αντικαταστήσει μεγάλο μέρος της γρύλευσης χωρίς το βαρύ τίμημα που συνδέεται με την ανθρώπινη εργασία. Καθώς η τεχνητή νοημοσύνη γίνεται πιο ικανή στην εκτέλεση βασικών εργασιών όπως η ανάλυση, η πρόβλεψη, ακόμη και η παρουσίαση, η μη αυτόματη φύση της επιστήμης δεδομένων γίνεται όλο και πιο περιττή. Πολλές εταιρείες θα συνειδητοποιήσουν ότι αυτό που απαιτούσε μια ομάδα επιστημόνων δεδομένων μπορεί τώρα να αντιμετωπιστεί πιο αποτελεσματικά από εργαλεία που τροφοδοτούνται με τεχνητή νοημοσύνη.
Η πραγματικότητα είναι ότι η επιστήμη των δεδομένων, όπως ορίζεται παραδοσιακά, βρίσκεται στο χείλος της απαρχαιότητας. Με τη γενετική τεχνητή νοημοσύνη να προχωρά με εκπληκτικό ρυθμό, η ζήτηση για επιστήμονες ανθρώπινων δεδομένων στην τρέχουσα μορφή τους πιθανότατα θα μειωθεί . Αυτό δεν σημαίνει ότι οι άνθρωποι δεν έχουν κανένα ρόλο στη λήψη αποφάσεων με γνώμονα τα δεδομένα, αλλά ο κλασικός ρόλος του «επιστήμονα δεδομένων» μπορεί σύντομα να είναι μια έννοια του παρελθόντος. Αυτό που χρειάζεται τώρα είναι επαγγελματίες ειδικευμένοι στη συνεργασία με την τεχνητή νοημοσύνη, αξιοποιώντας τις δυνατότητές της ενώ συγκεντρώνονται στη στρατηγική σκέψη και στην επίλυση σύνθετων προβλημάτων σε υψηλότερο επίπεδο.
Η τεχνητή νοημοσύνη δεν είναι το τέλος των αναλυτικών στοιχείων, των πληροφοριών ή της λήψης αποφάσεων — αντιπροσωπεύει την εξέλιξή τους . Το τρέχον πεδίο της επιστήμης δεδομένων κινδυνεύει να καταστεί παρωχημένο εάν δεν εξελιχθεί σταδιακά. Η τεχνητή νοημοσύνη φέρνει ήδη επανάσταση στις βιομηχανίες και η επιστήμη των δεδομένων πρέπει να προσαρμοστεί διαφορετικά κινδυνεύει να ξεπεραστεί από αυτό το κύμα. Τελικά, το ερώτημα μπορεί να μην είναι εάν η τεχνητή νοημοσύνη θα εξαλείψει την επιστήμη των δεδομένων, αλλά εάν η επιστήμη των δεδομένων θα εκπληρώσει ποτέ πλήρως τις υποσχέσεις της.
Ή ίσως η διάκριση δεν έχει καν σημασία αν τελικά ξεπεράσουμε τη διαφημιστική εκστρατεία της «επιστήμης δεδομένων» και υιοθετήσουμε την τεχνητή νοημοσύνη ως την επόμενη λογική εξέλιξη.
Σχετικά με εμένα: 25+ ετών βετεράνος πληροφορικής που συνδυάζει δεδομένα, τεχνητή νοημοσύνη, διαχείριση κινδύνου, στρατηγική και εκπαίδευση. Νικητής 4x hackathon και κοινωνικός αντίκτυπος από τον υπερασπιστή δεδομένων. Επί του παρόντος εργάζεται για την εκκίνηση του εργατικού δυναμικού της τεχνητής νοημοσύνης στις Φιλιππίνες. Μάθετε περισσότερα για εμένα εδώ: https://docligot.com