Όπως συμβαίνει συνήθως με τις ταχέως εξελισσόμενες τεχνολογίες, η τεχνητή νοημοσύνη έχει εμπνεύσει τεράστιες , και Κάποια από αυτά είναι άξια, Από τις νεοσύστατες επιχειρήσεις υλικού έως τους γίγαντες της χρηματοοικονομικής τεχνολογίας έως τους δημόσιους οργανισμούς, οι ομάδες εργάζονται με πυρετό στη στρατηγική τους για την τεχνητή νοημοσύνη. ΦΟΜΟ ΦΟΥΝΤ ΦΕΥΡΕΣ Μερικά από αυτά δεν «Πώς χρησιμοποιούμε την τεχνητή νοημοσύνη και τη μηχανική μάθηση για να γίνουμε καλύτεροι σε αυτό που κάνουμε;» «Πώς χρησιμοποιούμε την τεχνητή νοημοσύνη και τη μηχανική μάθηση για να γίνουμε καλύτεροι σε αυτό που κάνουμε;» Τις περισσότερες φορές, οι εταιρείες Έτοιμοι για την Ε.Ε. ίσως να έχουν προσλάβει τους σε λιγότερο από αστρικά αποτελέσματα, ή ίσως Αλλά το πιο συνηθισμένο σενάριο είναι ότι δεν έχουν ακόμη χτίσει την υποδομή για να εφαρμόσουν (και να αποκομίσουν τα οφέλη από) τις πιο βασικές αλγόριθμοι και λειτουργίες, πολύ λιγότερο . not Πρώτος επιστήμονας δεδομένων Πληροφορική Λογοτεχνία Επιστήμη δεδομένων μηχανική μάθηση Ως σύμβουλος επιστήμης δεδομένων / AI, έπρεπε να παραδώσω αυτό το μήνυμα αμέτρητες φορές, ειδικά τα τελευταία δύο χρόνια. Είναι δύσκολο να είσαι μια βρεγμένη κουβέρτα ανάμεσα σε όλο αυτό το ενθουσιασμό γύρω από το δικό σου πεδίο, ειδικά αν μοιράζεσαι αυτόν τον ενθουσιασμό.Και πώς λες στις εταιρείες ότι δεν είναι έτοιμες για την AI χωρίς να ακούγονται (ή να είναι) ελιτιστές - ένας αυτοδιορισμένος φύλακας πύλης; Συμφωνώ Εδώ είναι μια εξήγηση που αντηχεί περισσότερο: Think of AI as the top of a Η πυραμίδα των αναγκών . Yes, self-actualization (AI) is great, but you first need food, water and shelter (data literacy, collection and infrastructure). Η πυραμίδα των αναγκών Βασικές ανάγκες: Μπορείτε να μετρήσετε; Στο κάτω μέρος της πυραμίδας έχουμε Ποια δεδομένα χρειάζεστε και τι είναι διαθέσιμο; Εάν πρόκειται για προϊόν προσανατολισμένο προς τον χρήστη, καταγράφετε όλες τις σχετικές αλληλεπιδράσεις των χρηστών; Εάν πρόκειται για αισθητήρα, ποια δεδομένα περνούν και πώς; Πόσο εύκολο είναι να καταγράψετε μια αλληλεπίδραση που δεν είναι ακόμη ελεγχόμενη; Μετά από όλα, το σωστό Αυτό είναι που έκανε τις πρόσφατες εξελίξεις στη μηχανική μάθηση εφικτή. data collection Δεδομένα Στη συνέχεια, πώς γίνεται η μέσω του συστήματος; Έχετε αξιόπιστα ρεύματα / ETL ? Πού το αποθηκεύετε, και πόσο εύκολο είναι να έχετε πρόσβαση και να αναλύσετε; Έχει πει (για περίπου μια δεκαετία) ότι η αξιόπιστη ροή δεδομένων είναι το κλειδί για να κάνετε οτιδήποτε με τα δεδομένα. data flow Τζέι Κρέιπς [Από την άλλη πλευρά: Αναζητούσα ένα ακριβές απόσπασμα και το βρήκα στο ‘ Λατρεύω τα logs ’ αριστούργημα. τότε παρατήρησα ότι, μια παράγραφο πάνω, κάνει αυτή την ακριβή ιεραρχία των αναγκών του Maslow σύγκριση, με ένα «αξίζει να σημειωθεί το προφανές» ρίχνονται εκεί για καλό μέτρο (ευχαριστώ Jay!). Το ποστ Τι κάνει ένας επιστήμονας δεδομένων; Πριν από λίγες μέρες, Sean Taylor ΑΝΑΚΑΛΥΨΗ δική του πυραμίδα της επιστήμης των δεδομένων των αναγκών (ιρωνικά αποκαλούμενη το Unconjoined Triangle of Data Science) η οποία, φυσικά, είναι εντελώς διαφορετική. Λατρεύω τα logs Το ποστ ΑΝΑΚΑΛΥΨΗ Μόνο όταν τα δεδομένα είναι διαθέσιμα, μπορείτε να Αυτό περιλαμβάνει το διαβόητο «καθαρισμό δεδομένων», μια υποτιμημένη πλευρά της επιστήμης των δεδομένων που θα είναι το θέμα μιας άλλης θέσης.Αυτό είναι όταν ανακαλύπτετε ότι λείπετε μια δέσμη δεδομένων, οι αισθητήρες σας είναι αναξιόπιστοι, μια αλλαγή έκδοσης σήμαινε ότι τα γεγονότα σας πέφτουν, εσείς παρερμηνεύετε μια σημαία - και επιστρέφετε για να βεβαιωθείτε ότι η βάση της πυραμίδας είναι σταθερή. explore and transform Όταν είστε σε θέση να εξερευνήσετε αξιόπιστα και να καθαρίσετε τα δεδομένα, μπορείτε να αρχίσετε να δημιουργείτε αυτό που θεωρείται παραδοσιακά ως BI ή BI. : καθορίστε μετρήσεις για την παρακολούθηση, την εποχικότητά τους και την ευαισθησία τους σε διάφορους παράγοντες. Ίσως κάνοντας κάποια σκληρή κατανομή των χρηστών και δείτε αν κάτι πηδάει. Σε αυτό το στάδιο, γνωρίζετε επίσης τι θα θέλατε να προβλέψετε ή να μάθετε και μπορείτε να αρχίσετε να προετοιμάζετε δημιουργώντας ετικέτες, είτε αυτόματα (ποιοι πελάτες τσιμπήθηκαν;) είτε με ανθρώπους στον κύκλο. analytics features training data Αυτό είναι επίσης όταν βρίσκετε το πιο συναρπαστικό και συναρπαστικό Αλλά αυτό είναι και το θέμα ενός άλλου μεσαίου άρθρου. data stories Μπορώ να μετρήσω, τώρα τι; Έχουμε δεδομένα κατάρτισης – σίγουρα, τώρα μπορούμε να κάνουμε μηχανική μάθηση; Ίσως, αν προσπαθείτε να προβλέψετε εσωτερικά το τι θα συμβεί, όχι, αν το αποτέλεσμα θα είναι προσανατολισμένο στον πελάτη. το πλαίσιο, ώστε να μπορέσουμε να το αναπτύξουμε σταδιακά για να αποφύγουμε τις καταστροφές και να λάβουμε μια κατά προσέγγιση εκτίμηση των επιπτώσεων των αλλαγών πριν επηρεάσουν όλους. (για συστήματα συνιστώμενων, αυτό θα ήταν π.χ. «το πιο δημοφιλές», στη συνέχεια «το πιο δημοφιλές για το τμήμα των χρηστών σας» - το πολύ ενοχλητικό αλλά αποτελεσματικό «στερεότυπο πριν από την εξατομίκευση»). experimentation simple baseline Απλές ηουριστικές είναι εκπληκτικά δύσκολο να νικήσει, και θα σας επιτρέψει να ξεφορτωθείτε το σύστημα από άκρο σε άκρο χωρίς μυστηριώδη μαύρα κουτιά ML με υπερ-παραμέτρους υπερέντασης στη μέση. Σε αυτό το σημείο, μπορείτε να αναπτύξετε έναν πολύ απλό αλγόριθμο ML (όπως η εφοδιαστική παλινδρόμηση ή, ναι, η διαίρεση), στη συνέχεια να σκεφτείτε νέα σήματα και χαρακτηριστικά που θα μπορούσαν να επηρεάσουν τα αποτελέσματά σας. Τα δεδομένα καιρού και απογραφής είναι τα go-tos μου. Και όχι - όσο ισχυρή είναι, η βαθιά μάθηση δεν το κάνει αυτό αυτόματα για εσάς. Η εισαγωγή νέων σημάτων (δημιουργία χαρακτηριστικών, όχι μηχανική χαρακτηριστικών) είναι αυτό που μπορεί να βελτιώσει την απόδοσή σας με άλματα και όρια. Πάρτε το AI! Εσείς το κάνατε. Είστε εξοπλισμένοι. Το ETL σας χτυπάει. Τα δεδομένα σας είναι οργανωμένα και καθαρά. Έχετε πίνακες παρακολούθησης, ετικέτες και καλές λειτουργίες. Μετράτε τα σωστά πράγματα. Μπορείτε να πειραματιστείτε καθημερινά. Έχετε έναν αλγόριθμο βασικής γραμμής που έχει αναθεωρηθεί από το τέλος στο τέλος και τρέχει στην παραγωγή - και έχετε αλλάξει δεκάδες φορές. Είστε έτοιμοι. Πηγαίνετε μπροστά και δοκιμάστε όλα τα τελευταία και τα καλύτερα εκεί έξω - από τη ροή των δικών σας εταιρειών που ειδικεύονται στην μηχανική μάθηση. Μπορείτε να πάρετε κάποιες μεγάλες βελτιώσεις στην παραγωγή ή δεν μπορείτε. Στην χειρότερη περίπτωση, μαθαίνετε νέες με Περιμένετε, τι γίνεται με τα MVPs, το agile, το lean και όλα αυτά; Ακριβώς όπως όταν χτίζετε ένα παραδοσιακό MVP (ελάχιστα βιώσιμο προϊόν), ξεκινάτε με ένα μικρό, κάθετο τμήμα του προϊόντος σας και το κάνετε να λειτουργεί καλά από άκρη σε άκρη. Μπορείτε να χτίσετε την πυραμίδα της, στη συνέχεια να την αναπτύξετε οριζόντια. Για παράδειγμα, στο Jawbone, ξεκινήσαμε με τα δεδομένα ύπνου και χτίσαμε την πυραμίδα της: οργάνωση, ETL, καθαρισμός & οργάνωση, συλλογή ετικετών και ορισμοί, μετρήσεις (ποια είναι η μέση # των ωρών που κοιμούνται οι άνθρωποι κάθε βράδυ; Τι είναι η νύχτα; Τι είναι η νύχτα;), η ανάλυση των διατομείων και προϊόντα δεδομένων που βασίζονται στη μηχανική μάθηση (αυτόματη ανίχνευση ύπνου). Αυτό στα βήματα, στη συνέχεια το φαγητό, ο καιρός, οι προπονήσεις, τα κοινωνικά δίκτυα και η επικοινωνία – ένα προς ένα. The data science hierarchy of needs is not an excuse to build disconnected, over-engineered infrastructure for a year. Ιστορίες δεδομένων Επέκταση Θέτοντας τις σωστές ερωτήσεις και δημιουργώντας τα σωστά προϊόντα Πρόκειται μόνο για το πώς θα Όχι αν εσύ (για πρακτικούς ή ηθικούς λόγους) could should Η υπόσχεση των εργαλείων μηχανικής μάθησης ‘ ’ Τι γίνεται με το Amazon API ή το TensorFlow ή την άλλη βιβλιοθήκη ανοιχτού κώδικα; Τι γίνεται με τις εταιρείες που πωλούν εργαλεία ML ή που εξάγουν αυτόματα πληροφορίες και χαρακτηριστικά; Όλα αυτά είναι καταπληκτικά και πολύ χρήσιμα. (Μερικές εταιρείες καταλήγουν να προσαρμόζουν επιμελώς ολόκληρη την πυραμίδα σας έτσι ώστε να μπορούν να παρουσιάσουν το έργο τους. είναι ήρωες.) Ωστόσο, υπό την ισχυρή επιρροή του τρέχοντος hype AI, οι άνθρωποι προσπαθούν να συνδέσουν δεδομένα που είναι βρώμικα και γεμάτα κενά, τα οποία εκτείνονται χρόνια ενώ αλλάζουν μορφή και νόημα, αυτό δεν είναι ακόμα κατανοητό, αυτό είναι δομημένο με τρόπους που δεν έχουν νόημα και αναμένουν αυτά τα εργαλεία να το χειριστούν μαγικά.