En el episodio de hoy del podcast Brains Byte Back, hablamos con Walter Paliska , vicepresidente de marketing de dotData , una empresa que democratiza el uso de la IA y el aprendizaje automático al facilitar que las organizaciones aprovechen el poder de sus datos de forma rápida, herramientas únicas y fáciles de usar.
En este episodio, analizamos cómo comenzó la empresa, cómo ha crecido y las soluciones que ofrece actualmente. También exploramos la extracción de datos predictivos y cómo ayuda a las empresas a aprovechar los datos históricos para hacer predicciones precisas sobre el comportamiento o los resultados futuros.
Paliska se basa en el ejemplo del marketing y argumenta que una empresa podría usar la minería de datos predictiva para predecir el comportamiento de los visitantes en un sitio web para una orientación personalizada.
Además, Paliska comparte cómo se fundó dotData, después de que el CEO y fundador de la empresa, Ryohei Fujimaki, notara que su equipo de científicos de datos dedicaría una gran cantidad de tiempo al proceso de ingeniería de funciones.
Dado que esta era la parte manual y que consumía más tiempo del proceso de ciencia de datos, Fujimaki decidió utilizar la automatización para resolver este problema, y así nació dotData.
Paliska también comparte cómo la empresa ayuda a los clientes a ahorrar tiempo y costos en proyectos de ciencia de datos, democratizando la ciencia de datos para los que no son científicos de datos y mejorando la precisión y la velocidad de los modelos de aprendizaje automático .
Él argumenta que estas son solo algunas de las formas en que dotData se distingue de la competencia. Pero Paliska defiende que uno de los mayores diferenciadores es el motor central de dotData, que automatiza el proceso de ingeniería de características.
La ingeniería de características es un paso vital en la creación de modelos efectivos de aprendizaje automático, pero también es un proceso complejo que puede llevar mucho tiempo. Normalmente, los científicos de datos pasarían meses creando tablas de características que luego se ingresarían manualmente en los algoritmos de aprendizaje automático.
Sin embargo, dotData automatiza este proceso, identificando las conexiones entre diferentes tablas y construyendo tablas de características automáticamente. Según Paliska, este enfoque permite que dotData se destaque y es una de las razones clave por las que la empresa ha logrado un nivel tan alto de éxito en el mercado.
Puede escuchar en Spotify , Anchor , Apple Podcasts , Breaker ,Google Podcasts , Stitcher , Overcast , Listen Notes , PodBean y Radio Public.
Walter: Mi nombre es Walter Walter Paliska. Soy el vicepresidente de marketing de dotData. He estado con dotData desde mayo de 2019. Hace casi cuatro años. Y dotData es un proveedor líder de soluciones de automatización de ciencia de datos, tenemos en gran medida a los tipos de clientes a los que tendemos a apuntar, equipos asignados experimentados principalmente en organizaciones más grandes que buscan automatizar la parte de ingeniería de funciones de su trabajo. Y el otro son más empresas que recién se están iniciando en el mundo del análisis predictivo y en el mundo de la ciencia de datos, y están buscando soluciones de automatización para tratar de empoderar a los científicos que no son de datos en el proceso de construcción de datos y modelos de aprendizaje automático. Procesos científicos integrados para hacer análisis predictivos.
Sam: Impresionante, fantástico. Bueno, muchas gracias por acompañarme hoy. Es un placer tenerte aquí. Y tengo mucha curiosidad por saber cuándo y cómo hacer la primera parada de dotData.
Walter: Sí, muy buena pregunta. Entonces, en realidad, la historia de dotData se remonta bastante atrás. Ryohei Fujimaki, director ejecutivo y fundador de dotData, es un ex empleado de NEC en Japón. Así que en realidad era lo que se conoce como becario de investigación de NEC. Ahora, no ha habido tantos en la historia de la empresa, y él ve que una empresa bastante antigua se remonta a más de 100 años. Y se me olvida el número exacto, no quiero mentirte. Pero sé que, ya sabes, ha habido muy pocos becarios de investigación de NEC en la historia de la empresa, él fue el más joven en la historia de la empresa. Y él era parte de su equipo de ciencia de datos, y prácticamente de datos de tendencias, su organización de ciencia de datos desde una perspectiva de servicios, ¿verdad? Entonces harían un trabajo basado en proyectos yendo a las cuentas. Y la idea detrás de dotData realmente se originó. A lo largo de su experiencia con NEC, una de las cosas que notó constantemente fue que su equipo de datos, los científicos, siempre pasaban una cantidad excesiva de tiempo en partes específicas del proceso de ciencia de datos. Y entrar un poco en las malas hierbas técnicas aquí. Pero hay una parte de la especialidad conocida como ingeniería de características, que es realmente la parte más manual del proceso que consume más tiempo. Y siguió viendo que literalmente pasarían meses en el proceso de ingeniería de funciones. Y todavía estarían en un punto en el que ni siquiera habían jugado con ningún algoritmo de aprendizaje automático para descubrir cómo debería ser el modelo. Y sabes, ese es obviamente un momento de ajá, en algún momento que te dice que hay algo allí. Así que hay una necesidad aquí, hay una automatización que quizás podría resolver ese problema. Y ahí es donde se originó la idea detrás de dotData en la empresa que se fundó como un spin-off de NEC Corporation en 2018. En Japón, por lo que originalmente nació en Japón, pero con sede central nueve, Estados Unidos, tenemos todas nuestras sedes, si Disponemos de personal y empresa bastante repartida. Estamos en todo el mundo, tenemos gente en Europa, tenemos gente en Japón, tenemos gente en los Estados Unidos. Y eso nos lleva a donde estamos hoy.
Sam: Impresionante. Esa es una fantástica historia de éxito. Y también tengo mucha curiosidad por saber cuál es la historia detrás del nombre dotData porque para nuestros oyentes, se escribe como punto punto, pero con una d minúscula, y luego data con una D mayúscula justo después. De donde vino eso?
Walter: Gran pregunta. Entonces, la inspiración original detrás del nombre dotData realmente proviene de, ya sabes, una de las ideas de que eran el grupo de personas que encontraron que una empresa estaba jugando fue, ya sabes, estamos hablando como, probablemente cuando esta idea fue se inició por primera vez alrededor de 2016 2017. Por lo tanto, hubo muchas conversaciones en el mundo sobre los datos y el volumen de datos y la cantidad de datos que se generaban en todo el mundo diariamente. Y se les ocurrió, ya sabes, la iteración anterior de Internet, por así decirlo, en la década de 1990 y la década de 2000. Se trataba de dotnet. ¿Bien? Y la red, y pensaron, bueno, la próxima iteración del mundo realmente será sobre datos. Entonces esos datos, en lugar de datos de punto de .net. Esa fue la intención original detrás del nombre dotData.
Sam: Bueno, sí, eso tiene sentido con mucha más claridad. Con eso en mente. También me encanta la aliteración del DD, los datos de puntos, tiene un sonido muy agradable cuando dices
Walter: Sí, es un nombre memorable, y es fácil marcarlo.
Sam: Sí, sí, lo entiendo completamente. Y también quiero saber, como, en noviembre del año pasado, ustedes en dotData publicaron un artículo llamado ¿Qué es la minería de datos predictiva? Obviamente, recomiendo encarecidamente a los oyentes que vayan a comprobarlo. Pero ya que está aquí, ¿podría darnos una breve descripción de lo que es la minería de datos predictiva?
Walter: Claro, absolutamente. Entonces, obviamente, desde la perspectiva de la audiencia, aquellos que no están familiarizados con él, es posible que haya oído hablar de él en una terminología diferente, puede haber oído hablar de análisis predictivo, minería de datos predictiva, minería de datos en sí misma. , técnicamente, no son exactamente lo mismo, si realmente quiere dividir el cabello, pero para una especie de audiencia amplia, la minería de datos predictiva y el análisis predictivo realmente se trata de aprovechar los datos históricos que tiene en su organización. . Por ejemplo, un buen caso de uso podría ser en marketing, es posible que desee predecir el comportamiento de los visitantes en su sitio web para un carrito de compras, ¿verdad? Y tienes datos históricos sobre, ya sabes, cuáles son las acciones que ciertas personas toman antes de comprar un producto específico. Y quiere usar esos datos, quiere extraer esos datos, y usar técnicas y algoritmos muy específicos, como el análisis de árboles de decisión o la inducción de reglas, la agrupación, la detección de valores atípicos y otros tipos de técnicas de minería de datos, para identificar el patrones, determinar, ya sabes, visitar los conocimientos, parte del análisis predictivo, construir esos conocimientos. Estas también se denominan a veces características en el mundo del aprendizaje automático, pero descubra las ideas que le dicen que está bien, esto es lo que tiende a suceder. Cada vez que alguien compra un producto en particular en el ejemplo que acabamos de tener, y luego lo lleva un paso más allá y dice: Bien, ahora puedo usar ciertos algoritmos de aprendizaje automático para tratar de predecir la probabilidad de que alguien compre un producto cuando toman ciertas medidas específicas. comportamiento. La razón por la que es importante para usted como especialista en marketing para el ejemplo que acabo de dar es que, si puedo predecir con cierto grado de precisión, lo que sucederá cuando alguien realice ciertas acciones específicas, puedo impulsar a las personas hacia esas acciones, ahora puedo aprovechar esa información para optimizar mis campañas de marketing. Así que eso es minería de datos predictiva en pocas palabras, se vuelve mucho más complicado muy rápidamente, hay mucho más de qué hablar. Así que les he dado literalmente la versión 32 de los chicos de marketing, mucha más información disponible en nuestro sitio web, y estamos felices de reunirnos con cualquiera que obviamente quiera aprender más sobre esto. Estamos muy interesados en educar al mercado tanto como sea posible sobre esto.
Sam: Sí, me imagino que eso puede complicarse bastante rápido. Así que realmente aprecio que nos brinde esa breve descripción general. Y creo que hiciste un buen trabajo al resumir lo que parece ser un tema muy complejo. Ahora, también quiero saber, ¿hay otras empresas que operen este espacio? Y si es así, ¿cómo se diferencian ustedes de la competencia, amigos de dotData?
Walter: Gran pregunta. Entonces, la respuesta corta es sí, por supuesto, hay muchas otras empresas que operan en este espacio. Y habiendo dicho eso, lo único que probablemente también sea una perogrullada sobre el espacio de análisis predictivo de corte de Machine Learning, es que se está desarrollando y está cambiando a un ritmo increíblemente rápido. Entonces, si observa el posicionamiento de las empresas, digamos, hace tres o cuatro años, cuando me uní a dotData por primera vez, en comparación con cómo esas mismas empresas se posicionan hoy, cómo se construyen sus productos hoy, dónde lo hacen hoy, conversaciones radicalmente diferentes. . Y eso realmente ha sido impulsado en gran medida por la rapidez con que se desarrolla el mercado. Sin embargo, a través de todo eso, el gran diferenciador de esos datos realmente se reduce al motor central de dotData y cómo funciona dotData. Entonces, una de las cosas que no he hablado, y de nuevo, esto obtiene un poco de profundidad técnica de esta conversación, pero es importante que en el mundo del análisis predictivo, cuando vas y use estos algoritmos de aprendizaje automático para construir sus modelos predictivos, estos algoritmos de aprendizaje automático como tablas planas, esencialmente, no son felices. Entonces, si sabe si no sabe cuánto sabe sobre datos empresariales, pero especialmente en el mundo de los datos empresariales, si piensa en algo como salesforce.com, por ejemplo, como usuario de salesforce.com, simplemente ver una pantalla de clientes potenciales y tiene información de clientes potenciales. Y como mis actividades contra mis clientes potenciales, todo está en un solo lugar. Pero si quito las cubiertas de eso y miro debajo de las entrañas, por así decirlo, de cómo funciona este sistema, es básicamente lo que se llama una base de datos relacional. Entonces, todos esos campos que veo, muchos de ellos son en realidad partes de diferentes tablas entregadas en diferentes partes del vendedor, todos están conectados entre sí. Bueno, a los algoritmos de aprendizaje automático no les gustan esas cosas, los algoritmos de aprendizaje automático, como las tablas planas, los algoritmos de aprendizaje automático, las cosas que parecen CSV parecen hojas de cálculo. Entonces, una gran parte del aprendizaje automático es lo que se llama ingeniería de características, que es esencialmente un proceso de tomar estas complejas tablas de datos relacionales, descubrir los patrones que tienen sentido para su algoritmo de aprendizaje automático y construir estas tablas planas esencialmente, que luego tiene que alimentar los algoritmos de aprendizaje automático. El principal diferenciador principal de dotData es que hacemos esa parte automáticamente. Eso es tradicionalmente un proceso muy práctico. Si vuelvo a cuando me hiciste la primera pregunta, sabes cómo se originaron esos datos. Ese fue el momento de sorpresa que nuestro director ejecutivo estaba viendo. En estos datos, los científicos dedicaron literalmente meses a crear estas tablas de funciones que luego tendrían que introducir manualmente en los algoritmos de aprendizaje automático. Y al darnos cuenta de que tiene que haber una mejor manera, tenemos que ser capaces de construir un sistema que encuentre automáticamente las conexiones entre estas tablas, identifique automáticamente los patrones que son relevantes y útiles, y construya estas tablas de características automáticamente. Así que ese es, con mucho, nuestro mayor diferenciador. Y hoy, somos realmente la única compañía en el mercado que proporciona esa funcionalidad.
Sam: Bueno, eso tiene sentido. Sí. Y siempre me encanta el hecho de que cada vez que entrevisto a personas, siempre parece que hay algún tipo de momento de sorpresa en la base de todas estas empresas con las que hablo. Y es realmente, es una parte muy divertida de mi trabajo llegar a esa unidad central, supongo, por lo que tiene mucho sentido. Y tengo curiosidad por saber, ¿qué sigue en el horizonte para ustedes, amigos de dotData?
Walter : Así que creo que, ya sabes, desde un par de perspectivas, ¿verdad? Uno es de, obviamente, ya que el crecimiento de un negocio es el área de mayor interés para nosotros. Y, de hecho, una de las cosas que pensamos, especialmente dada la incertidumbre económica que está ocurriendo en este momento, los sistemas como esos datos en realidad se vuelven aún más beneficiosos para las organizaciones. Ya sabes, cuando el dinero se invirtió, el capital era abundante y las organizaciones no tenían que preocuparse por el número de empleados y no tenían que preocuparse por, ya sabes, simplemente podías contratar para resolver el problema, ¿verdad? Necesitaba hacer las cosas más rápido, contrató a más científicos de datos, necesitó crear productos más rápido, contrató a más ingenieros de datos, etc. Bueno, con la economía haciendo lo que está haciendo en este momento, en realidad estamos viendo un aumento en la demanda, en realidad estamos viendo más empresas que dicen, no tengo la capacidad de expandir mi equipo, no tengo el permiso. , por así decirlo financieramente, para ir y contratar 1015 20 Más científicos de datos. Entonces, ¿cómo puedo hacer que mi equipo existente sea más productivo? Y ahí es donde dotData puede brindarles mucha ayuda. Así que vemos muchas oportunidades a corto plazo, así como a largo plazo desde esa perspectiva. Y, obviamente, tenemos muchas ideas y muchas cosas nuevas que se avecinan desde la perspectiva del producto, la mayoría de las cuales no puedo hablar todavía, pero algunas cosas muy emocionantes que vendrán en el segundo mitad de este año, que continuará ampliando las capacidades del producto y también nos llevará a algunas áreas nuevas en las que no hemos estado antes.
Sam: Fantástico. Bueno, parece que ustedes tienen mucho que hacer. Y te deseo la mejor de las suertes con eso. Y si las personas están escuchando y están interesadas en mantenerse al tanto de usted, personalmente, Walter o dotData, ¿dónde pueden ir para hacerlo?
Walter: Gran pregunta. Para que dotData sea el más fácil, simplemente vaya a dotdata.com. Para conectarse conmigo personalmente, puede encontrarme en la página de liderazgo. Si va a nuestra página Acerca de y luego a Liderazgo, verá mi foto, mi biografía y puede hacer clic directamente en mi perfil de LinkedIn, o mi perfil de LinkedIn es bastante simple. Es solo https://www.linkedin.com/in/walterpaliska/ ve a mi perfil de LinkedIn y comunícate conmigo.
Sam : Excelente. Bueno, también incluiremos enlaces en la descripción de este episodio, para que los oyentes puedan ir allí. Pero por lo demás, Walter, muchas gracias por acompañarme hoy.
Walter: Muchas gracias por la oportunidad y gracias a todos sus oyentes.
Este artículo fue publicado originalmente por Sam Brake Guia en The Sociable
La imagen principal de este artículo fue generada porAI Image Generator de HackerNoon a través del mensaje "personas en computadoras en un cibercafé por la noche".