Dans l'épisode d'aujourd'hui du podcast Brains Byte Back, nous discutons avec Walter Paliska , vice-président du marketing chez dotData , une entreprise qui démocratise l'utilisation de l'IA et de l'apprentissage automatique en permettant aux organisations d'exploiter facilement la puissance de leurs données grâce à des des outils uniques et faciles à utiliser.
Dans cet épisode, nous expliquons comment l'entreprise a commencé, comment elle s'est développée et les solutions qu'elle propose actuellement. Nous explorons également l'exploration de données prédictive et comment elle aide les entreprises à tirer parti des données historiques pour faire des prédictions précises sur le comportement ou les résultats futurs.
Paliska s'appuie sur l'exemple du marketing, arguant qu'une entreprise pourrait utiliser l'exploration de données prédictive pour prédire le comportement des visiteurs sur un site Web pour un ciblage personnalisé.
De plus, Paliska raconte comment dotData a été fondée, après que le PDG et fondateur de la société, Ryohei Fujimaki, ait remarqué que son équipe de data scientists passerait énormément de temps sur le processus d'ingénierie des fonctionnalités.
Comme il s'agissait de la partie la plus chronophage et la plus manuelle du processus de science des données, Fujimaki a décidé d'utiliser l'automatisation pour résoudre ce problème, c'est ainsi que dotData est né.
Paliska explique également comment l'entreprise aide ses clients à gagner du temps et de l'argent sur les projets de science des données, en démocratisant la science des données pour les non-scientifiques et en améliorant la précision et la vitesse des modèles d'apprentissage automatique .
Il soutient que ce ne sont là que quelques-unes des façons dont dotData se distingue de la concurrence. Mais Paliska préconise que l'un des plus grands différenciateurs est le moteur central de dotData, qui automatise le processus d'ingénierie des fonctionnalités.
L'ingénierie des fonctionnalités est une étape essentielle dans la création de modèles d'apprentissage automatique efficaces, mais il s'agit également d'un processus complexe qui peut prendre beaucoup de temps. Normalement, les scientifiques des données passeraient des mois à créer des tables de caractéristiques qui seraient ensuite saisies manuellement dans les algorithmes d'apprentissage automatique.
Cependant, dotData automatise ce processus, identifiant les connexions entre les différentes tables et créant automatiquement des tables de caractéristiques. Selon Paliska, cette approche permet à dotData de se démarquer et est l'une des principales raisons pour lesquelles l'entreprise a atteint un tel succès sur le marché.
Vous pouvez écouter sur Spotify , Anchor , Apple Podcasts , Breaker ,Google Podcasts , Stitcher , Overcast , Listen Notes , PodBean et Radio Public.
Walter : Je m'appelle Walter Walter Paliska. Je suis le vice-président du marketing pour dotData. Je suis chez dotData depuis mai 2019. Donc presque quatre ans maintenant. Et dotData est un fournisseur leader de solutions d'automatisation de la science des données, nous avons en grande partie pour les types de clients que nous avons tendance à cibler, des équipes expérimentées affectées principalement dans les grandes organisations qui cherchent à automatiser la partie ingénierie des fonctionnalités de leur travail. Et l'autre est plus d'entreprises qui ne font que commencer dans le monde de l'analyse prédictive et dans le monde de la science des données, et qui recherchent des solutions d'automatisation pour essayer de responsabiliser les non-scientifiques des données dans le processus de création de modèles et de données d'apprentissage automatique. processus scientifiques intégrés pour effectuer des analyses prédictives.
Sam : Génial, fantastique. Eh bien, merci beaucoup de m'avoir rejoint aujourd'hui. C'est un plaisir de vous avoir ici. Et je suis vraiment curieux de savoir quand et comment dotData s'arrête pour la première fois ?
Walter : Oui, excellente question. Donc, en fait, l'histoire de dotData remonte à loin. Ryohei Fujimaki, PDG et fondateur de dotData, est un ancien employé de NEC au Japon. Il était donc en fait ce qu'on appelle un chercheur associé du NEC. Maintenant, il n'y en a pas eu autant dans l'histoire de l'entreprise, et il voit qu'une entreprise assez ancienne remonte à plus de 100 ans. Et j'oublie le nombre exact, je ne veux pas te mentir. Mais je sais que, vous savez, il y a eu très peu de boursiers de recherche NEC dans l'histoire de l'entreprise, il était le plus jeune de l'histoire de l'entreprise. Et il faisait partie de leur équipe de science des données, et à peu près des données de tendance, leur organisation de science des données du point de vue des services, à droite. Ils feraient donc un travail basé sur des projets allant aux comptes. Et l'idée derrière dotData est en fait née. Au cours de son expérience avec NEC, l'une des choses qu'il n'a cessé de remarquer était que son équipe de données, les scientifiques passaient toujours un temps excessif sur des parties spécifiques du processus de science des données. Et entrer un peu dans les mauvaises herbes techniques ici. Mais il y a une partie de la spécialité connue sous le nom d'ingénierie des fonctionnalités, qui est vraiment la partie la plus manuelle du processus qui prend le plus de temps. Et il n'arrêtait pas de voir qu'ils passeraient littéralement des mois sur le processus d'ingénierie des fonctionnalités. Et ils en seraient encore à un point où ils n'avaient même pas encore joué avec des algorithmes d'apprentissage automatique pour comprendre à quoi le modèle devrait ressembler. Et vous savez, c'est évidemment un moment aha, à un moment donné, cela vous dit qu'il y a quelque chose là-bas. Il y a donc un besoin ici, l'automatisation pourrait peut-être résoudre ce problème. Et c'est là que l'idée derrière dotData est née dans l'entreprise a été fondée en tant que spin-off de NEC Corporation en 2018. Au Japon, et donc à l'origine né au Japon, mais entièrement neuf, aux États-Unis, nous avons tous nos sièges sociaux, si vous avoir du personnel et une entreprise assez distribuée. Nous sommes dans le monde entier, nous avons des gens en Europe, nous avons des gens au Japon, avec des gens aux États-Unis. Et cela nous amène là où nous en sommes aujourd'hui.
Sam : Génial. C'est une réussite fantastique. Et je suis également très curieux de savoir quelle est l'histoire derrière le nom dotData car pour nos auditeurs, il s'écrit comme point point, mais avec un d minuscule, puis data avec un D majuscule juste après. D'où vient cela?
Walter : Excellente question. Donc, l'inspiration originale derrière le nom dotData vient vraiment, vous savez, l'une des idées qu'ils étaient le groupe de personnes avec lesquelles une entreprise jouait était, vous savez, nous parlons comme, probablement quand cette idée était a été lancée pour la première fois vers 2016 2017. Il y a donc eu beaucoup de conversations dans le monde sur les données et le volume de données et la quantité de données générées quotidiennement dans le monde. Et cela leur est apparu, vous savez, l'itération précédente d'Internet, pour ainsi dire, dans les années 1990 et 2000. Étaient tout au sujet de dotnet. Droite? Et le réseau, et ils pensaient, eh bien, la prochaine itération du monde sera vraiment une question de données. Donc, ces données, donc au lieu de données de points.net. C'était donc l'intention initiale derrière le nom dotData.
Sam : D'accord, oui, c'est logique avec beaucoup plus de clarté. Dans cet esprit. J'aime aussi vraiment l'allitération de celui-ci, le DD, les données de points, ça a un très bon son quand vous dites
Walter : Ouais c'est un nom mémorable, et c'est, c'est facile de le marquer.
Sam : Ouais, ouais, je comprends tout à fait. Et je veux aussi savoir, par exemple, en novembre de l'année dernière, vous les gens de dotData avez publié un article intitulé qu'est-ce que l'exploration de données prédictive ? Évidemment, je recommanderais fortement aux auditeurs d'aller le vérifier. Mais pendant que vous êtes ici, pourriez-vous nous donner un bref aperçu de ce qu'est l'exploration de données prédictive ?
Walter : Bien sûr, absolument. Donc, évidemment, vous savez, du point de vue du public, ceux qui ne sont pas familiers avec cela, vous savez, vous en avez peut-être entendu parler dans une terminologie différente peut avoir entendu parler d'analyse prédictive, d'exploration de données prédictive. , techniquement, ce n'est pas tout à fait la même chose, si vous voulez vraiment couper les cheveux en quatre, mais pour, vous savez, une sorte de large public, l'exploration de données prédictive et l'analyse prédictive consistent vraiment à tirer parti des données historiques que vous avez dans votre organisation . Vous savez, par exemple, un bon cas d'utilisation pourrait être dans le marketing, vous pourriez vouloir prédire le comportement des visiteurs sur votre site Web pour un panier d'achat, n'est-ce pas ? Et vous avez des données historiques sur, vous savez, quelles sont les actions que certaines personnes entreprennent avant d'acheter un produit spécifique. Et vous voulez utiliser ces données, vous voulez exploiter ces données et utiliser des techniques et des algorithmes très spécifiques comme et vous savez, l'analyse d'arbre de décision ou l'induction de règles, le regroupement, la détection de valeurs aberrantes et d'autres types de techniques d'exploration de données, pour identifier le modèles, déterminez, vous savez, visitez en quelque sorte les informations, une partie de l'analyse prédictive, construisez ces informations. Celles-ci sont également parfois appelées fonctionnalités dans le monde de l'apprentissage automatique, mais découvrez les idées qui vous disent d'accord, c'est ce qui a tendance à se produire. Chaque fois que quelqu'un achète un produit particulier dans l'exemple que nous venons d'avoir, puis aller un peu plus loin et dire, d'accord, maintenant je peux utiliser certains algorithmes d'apprentissage automatique pour essayer de prédire la probabilité que quelqu'un achète un produit lorsqu'il prend certains Actions. La raison pour laquelle vous êtes important en tant que spécialiste du marketing pour l'exemple que je viens de donner est que, si je peux prédire avec un certain degré de précision, ce qui va se passer lorsque quelqu'un entreprend certaines actions spécifiques, je peux conduire les gens vers ces actions, je peux maintenant exploiter ces informations pour optimiser mes campagnes marketing. C'est donc de l'exploration de données prédictive en un mot, cela devient beaucoup plus compliqué très rapidement, il y a beaucoup plus à dire. Je vous ai donc donné littéralement la 32e version des gars du marketing, beaucoup plus d'informations disponibles sur notre site Web, et nous sommes heureux de rencontrer quiconque souhaite évidemment en savoir plus à ce sujet. Nous sommes très désireux d'éduquer le marché autant que possible à ce sujet.
Sam : Oui, je peux imaginer que cela peut devenir assez compliqué assez rapidement. J'apprécie donc vraiment que vous nous donniez ce bref aperçu. Et je pense que vous avez bien résumé ce qui semble être un sujet très complexe. Maintenant, je veux aussi savoir, y a-t-il d'autres entreprises qui exploitent cet espace ? Et si oui, par exemple, comment vous, les gens de dotData, vous différenciez-vous de la concurrence ?
Walter : Excellente question. Donc, la réponse courte est oui, bien sûr, il y a beaucoup d'autres entreprises qui opèrent dans cet espace. Et après avoir dit cela, la seule chose qui est probablement aussi un truisme à propos de l'espace d'analyse prédictive slash de Machine Learning, c'est qu'il se développe et change à un rythme incroyablement rapide. Donc, si vous regardez le positionnement des entreprises, disons, il y a trois ou quatre ans, lorsque j'ai rejoint dotData pour la première fois, par rapport à la façon dont ces mêmes entreprises se positionnent aujourd'hui, comment leurs produits sont construits aujourd'hui, où ils le font aujourd'hui, des conversations radicalement différentes . Et cela est vraiment dû en grande partie à la rapidité avec laquelle le marché se développe. À travers tout cela, cependant, le seul différenciateur énorme pour ces données se résume vraiment au moteur principal de dotData et au fonctionnement de dotData. Donc, l'une des choses dont je n'ai pas parlé, et encore une fois, cela donne un peu plus de profondeur technique à cette conversation, mais c'est important, c'est que dans le monde de l'analyse prédictive, d'accord, quand vous allez et utilisez ces algorithmes d'apprentissage automatique pour construire vos modèles prédictifs, ces algorithmes d'apprentissage automatique comme les tables plates, essentiellement, ils ne sont pas contents. Donc, si vous savez si vous ne savez pas ce que vous savez sur les données d'entreprise, mais surtout dans le monde des données d'entreprise, si vous pensez à quelque chose comme salesforce.com, par exemple, en tant qu'utilisateur de salesforce.com, je viens voir un écran de prospects et il contient des informations sur les prospects. Et comme mes activités contre mes pistes, tout est au même endroit. Mais si je retire les couvertures de cela et que je regarde dans les entrailles, pour ainsi dire, comment ce système fonctionne, c'est essentiellement ce qu'on appelle une base de données relationnelle. Donc, tous ces champs que je vois beaucoup d'entre eux font vraiment partie de différents tableaux livrés dans différentes parties du vendeur, ils sont tous connectés ensemble. Eh bien, les algorithmes d'apprentissage automatique n'aiment pas ces choses, les algorithmes d'apprentissage automatique, comme les tableaux plats, les algorithmes d'apprentissage automatique, comme les choses qui ressemblent à des CSV ressemblent à des feuilles de calcul. Donc, une grande partie de l'apprentissage automatique est ce qu'on appelle l'ingénierie des fonctionnalités, qui consiste essentiellement à prendre ces tables de données relationnelles complexes, à déterminer les modèles qui ont du sens pour votre algorithme d'apprentissage automatique et à construire essentiellement ces tables plates, que vous devez ensuite alimenter les algorithmes d'apprentissage automatique. Le plus grand différenciateur de base pour dotData est que nous faisons cette partie automatiquement. C'est traditionnellement un processus très pratique. Si je reviens au moment où vous m'avez posé la toute première question, vous savez d'où proviennent ces données. C'était le moment aha que notre PDG regardait Dans ces données, les scientifiques ont passé littéralement des mois à créer ces tables de caractéristiques qu'ils devraient ensuite mettre manuellement dans les algorithmes d'apprentissage automatique. Et en réalisant qu'il doit y avoir un meilleur moyen, nous devons être capables de construire un système qui trouvera automatiquement les connexions entre ces tables, identifiera automatiquement les modèles pertinents et utiles, et construira ces tables de caractéristiques automatiquement. C'est donc de loin notre plus grand différenciateur. Et aujourd'hui, nous sommes vraiment la seule entreprise du marché à offrir cette fonctionnalité.
Sam : OK, c'est logique. Ouais. Et j'aime toujours le fait que chaque fois que j'interviewe des gens, il semble toujours qu'il y ait une sorte de moment aha à la base de toutes ces entreprises avec lesquelles je parle. Et c'est vraiment, c'est une partie vraiment amusante de mon travail d'atteindre ce cœur, je suppose, donc c'est tout à fait logique. Et je suis curieux de savoir quelle est la prochaine étape à l'horizon pour vous chez dotData ?
Walter : Donc, je pense, vous savez, en quelque sorte à plusieurs points de vue, n'est-ce pas. L'un vient de, évidemment, car la croissance de l'entreprise est le plus grand domaine d'intérêt pour nous. Et en fait, l'une des choses que nous pensons, surtout compte tenu de l'incertitude économique qui se produit en ce moment, les systèmes comme ces données deviennent en fait encore plus bénéfiques pour les organisations. Vous savez, lorsque l'argent était investi, le capital était abondant et les organisations n'avaient pas à se soucier des effectifs et n'avaient pas à s'inquiéter, vous savez, vous pouviez simplement embaucher pour résoudre le problème, n'est-ce pas ? Vous deviez faire les choses plus rapidement, vous embauchiez plus de data scientists, vous deviez créer des produits plus rapidement, vous embauchiez plus d'ingénieurs de données, etc. Eh bien, avec l'économie qui fait ce qu'elle fait en ce moment, nous constatons en fait une augmentation de la demande, nous voyons en fait plus d'entreprises dire, je n'ai pas la capacité d'agrandir mon équipe, je n'ai pas la permission , pour ainsi dire financièrement, pour aller embaucher 1015 20 Plus de data scientists. Alors, comment puis-je rendre mon équipe existante plus productive. Et c'est là que dotData peut leur apporter beaucoup d'aide. Nous voyons donc beaucoup d'opportunités à court terme, ainsi qu'à long terme dans cette perspective. Et évidemment, nous avons beaucoup d'idées et beaucoup de nouvelles choses à venir du point de vue du produit, dont la plupart dont je ne peux pas vraiment parler pour l'instant, mais des choses très excitantes qui arrivent dans la seconde moitié de cette année, cela continuera à développer les capacités du produit et nous emmènera également dans de nouveaux domaines dans lesquels nous n'étions pas allés auparavant.
Sam : Fantastique. Eh bien, on dirait que vous avez beaucoup de choses à faire. Et je vous souhaite bonne chance avec ça. Et si les gens écoutent, et qu'ils sont intéressés à vous suivre, personnellement, Walter ou dotData, où peuvent-ils s'adresser pour le faire ?
Walter : Excellente question. Pour que dotData soit le plus simple, allez simplement sur dotdata.com. Pour communiquer avec moi personnellement, vous pouvez me trouver sur la page de leadership. Si vous allez sur notre page à propos, puis sur la direction, vous verrez ma photo ma biographie, et vous pouvez cliquer directement sur mon profil LinkedIn, ou mon profil LinkedIn est assez simple. C'est juste https://www.linkedin.com/in/walterpaliska/ allez sur mon profil LinkedIn et contactez-moi.
Sam : Excellent. Eh bien, nous inclurons également des liens dans la description de cet épisode, afin que les auditeurs puissent y accéder. Sinon, Walter, merci beaucoup de m'avoir rejoint aujourd'hui.
Walter : Merci beaucoup pour cette opportunité, et merci à tous vos auditeurs.
Cet article a été initialement publié par Sam Brake Guia sur The Sociable
L'image principale de cet article a été générée parle générateur d'images AI de HackerNoon via l'invite "personnes sur des ordinateurs dans un cybercafé la nuit".