Comme c’est souvent le cas avec les technologies à l’avant-garde, l’IA a inspiré des , à et Certaines sont méritées, Des start-ups de matériel caché aux géants de la fintech aux institutions publiques, les équipes travaillent avec fièvre sur leur stratégie d’IA. FOMO FUD féodales Certains d’entre eux ne « Comment utilisons-nous l’IA et l’apprentissage automatique pour être meilleurs dans ce que nous faisons ? » « Comment utilisons-nous l’IA et l’apprentissage automatique pour être meilleurs dans ce que nous faisons ? » Plus souvent que jamais, les entreprises Prêt pour AI. Peut-être qu'ils ont embauché leurs pour des résultats moins étoilés, ou peut-être Mais le scénario le plus commun est qu’ils n’ont pas encore construit l’infrastructure pour mettre en œuvre (et récolter les avantages) les plus basiques. des algorithmes et des opérations, beaucoup moins . not Le premier data scientist L’alphabétisation des données Science des données Machine à apprendre En tant que consultant en sciences des données/AI, j’ai dû transmettre ce message d’innombrables fois, en particulier au cours des deux dernières années. Il est difficile d'être une couverture mouillée parmi toute cette excitation autour de votre propre domaine, surtout si vous partagez cette excitation.Et comment dites-vous aux entreprises qu'elles ne sont pas prêtes pour l'IA sans paraître (ou être) élitiste - un gardien de porte auto-nommé? d'accord Voici une explication qui résonne le plus : Think of AI as the top of a La pyramide des besoins . Yes, self-actualization (AI) is great, but you first need food, water and shelter (data literacy, collection and infrastructure). La pyramide des besoins Les besoins de base : pouvez-vous compter ? Au fond de la pyramide, nous avons Quelles données avez-vous besoin et qu’est-ce qui est disponible ? si c’est un produit orienté vers l’utilisateur, vous enregistrez toutes les interactions utilisateur pertinentes ? si c’est un capteur, quelles données passent et comment ? C’est ce qui a rendu les progrès récents de l’apprentissage automatique possibles. data collection Données Ensuite, comment le Avez-vous des flux fiables / ETL ? Où le stockez-vous, et combien il est facile d'accéder et d'analyser? Depuis une dizaine d’années, le flux de données fiable est la clé pour faire n’importe quoi avec les données. data flow par Jay Kreps [Au-delà: Je cherchais une citation exacte et je l'ai trouvée dans son » J’aime les logos Puis j'ai remarqué que, un paragraphe plus haut, il fait cette comparaison exacte de la hiérarchie des besoins de Maslow, avec un "il vaut la peine de noter l'évident" jeté là-bas pour une bonne mesure (merci Jay!).Parlant du travail connexe, j'ai aussi plus tard couru (h / t Daniel Tunkelang) dans l'excellent de Hilary Mason et Chris Wiggins Posté Il y a quelques jours, Sean Taylor dévoilée sa propre pyramide des besoins de la science des données (dénommée ironiquement le triangle non-conjoint de la science des données) qui, bien sûr, est complètement différent. J’aime les logos Posté dévoilée Lorsque les données sont accessibles, vous pouvez C'est quand vous découvrez que vous manquez un tas de données, vos capteurs sont peu fiables, un changement de version signifiait que vos événements sont tombés, vous interprétez mal un drapeau - et vous revenez pour vous assurer que la base de la pyramide est solide. explore and transform Lorsque vous êtes en mesure d'explorer et de nettoyer les données de manière fiable, vous pouvez commencer à construire ce qui est traditionnellement considéré comme BI ou BI. : définir les mesures à suivre, leur saisonnalité et leur sensibilité à divers facteurs. Peut-être en faisant une segmentation de l'utilisateur brute et en voyant si quelque chose saute. à intégrer dans votre modèle d'apprentissage automatique. À ce stade, vous savez également ce que vous souhaitez prédire ou apprendre, et vous pouvez commencer à préparer votre par la génération d’étiquettes, soit automatiquement (quels clients ont craqué ?) ou avec des humains dans la boucle. analytics features training data C'est aussi quand vous trouvez votre plus excitant et convaincant Mais c'est aussi le sujet d'un autre post. data stories Je peux compter, et maintenant ? Nous avons des données de formation - certainement, maintenant nous pouvons faire de l'apprentissage automatique? Peut-être, si vous essayez de prédire de manière interne le churn; non, si le résultat va être client-facing. cadre en place, de sorte que nous puissions déployer progressivement pour éviter les catastrophes et obtenir une estimation brute des effets des changements avant qu'ils n'affectent tout le monde. en place (pour les systèmes de recommandation, cela serait par exemple « le plus populaire », puis « le plus populaire pour votre segment utilisateur » – le « stéréotype avant la personnalisation » très ennuyeux mais efficace). experimentation simple baseline Les heuristiques simples sont étonnamment difficiles à battre, et elles vous permettront de déboguer le système de bout en bout sans mystérieuses boîtes noires ML avec des hyperparamètres hypertuned au milieu. À ce stade, vous pouvez déployer un algorithme ML très simple (comme la régression logistique ou, oui, la division), puis penser à de nouveaux signaux et fonctionnalités qui pourraient affecter vos résultats. Les données météorologiques et de recensement sont mes go-tos. Et non – aussi puissant qu’il soit, l’apprentissage profond ne le fait pas automatiquement pour vous. L’introduction de nouveaux signaux (création de fonctionnalités, pas l’ingénierie de fonctionnalités) est ce qui peut améliorer vos performances par des sauts et des limites. Mettez sur le AI ! Vous l’avez fait. Vous êtes instrumenté. Votre ETL est en train d’éclater. Vos données sont organisées et nettoyées. Vous avez des tableaux de bord, des étiquettes et de bonnes fonctionnalités. Vous mesurez les bonnes choses. Vous pouvez expérimenter quotidiennement. Vous avez un algorithme de base qui est débogé de bout en bout et est en cours de production – et vous l’avez changé une douzaine de fois. Vous êtes prêt. Allez essayer toutes les dernières et les plus grandes choses là-bas – de rouler votre propre entreprise à utiliser des entreprises spécialisées dans l’apprentissage automatique. Vous pouvez obtenir des améliorations majeures dans la production, ou vous ne pouvez pas. Dans le pire des cas, vous apprenez de nouvelles méthodes, développez des opinions et Qu’en est-il des MVP, de l’agile, du lean et tout ça ? Tout comme lorsque vous construisez un MVP traditionnel (produit minimalement viable), vous commencez avec une petite section verticale de votre produit et vous le faites fonctionner bien de bout en bout. Vous pouvez construire sa pyramide, puis la cultiver horizontalement. Par exemple, à Jawbone, nous avons commencé avec les données du sommeil et construit sa pyramide: instrumentation, ETL, nettoyage & organisation, capture d'étiquettes et définitions, mesures (quelle est la moyenne # des heures que les gens dorment chaque nuit? et des produits de données basés sur l’apprentissage automatique (détection automatique du sommeil). Ensuite, c’est la nourriture, la météo, les séances d’entraînement, les réseaux sociaux et la communication – un à la fois.Nous n’avons pas construit une infrastructure complète sans jamais la mettre en œuvre. The data science hierarchy of needs is not an excuse to build disconnected, over-engineered infrastructure for a year. Histoires de données prolongé Poser les bonnes questions et créer les bons produits Il ne s’agit que de la façon dont vous Pas si vous (pour des raisons éthiques ou pratiques) could should Les outils d’apprentissage automatique ‘ ’ Qu’en est-il de cette API Amazon ou de TensorFlow ou de cette autre bibliothèque open source ? Tout cela est génial et très utile. (Certaines entreprises finissent par personnaliser votre pyramide entière afin qu’elles puissent montrer leur travail. Ils sont des héros.) Cependant, sous la forte influence du hype actuel de l’IA, les gens essaient de connecter des données qui sont sales et pleines de lacunes, qui s’étendent sur des années tout en changeant de format et de sens, ce qui n’est pas encore compris, ce qui est structuré de manière qui n’a pas de sens, et s’attendre à ce que ces outils le gèrent magiquement.