En HackerNoon, valoramos las historias sobre el desarrollo de tecnología innovadora. Estas preguntas no solo se refieren a la mecánica de la IA, sino también a la innovación, los desafíos y la creatividad de dar vida a herramientas de vanguardia, una opción perfecta para nuestra comunidad de líderes tecnológicos, desarrolladores y lectores con visión de futuro.
Mi nombre es Aniruth . Trabajo en el equipo de almacenamiento de Databricks , donde nos esforzamos por permitir que los clientes guarden grandes cantidades de datos en un formato abierto y escalable con nuestra plataforma de inteligencia de datos. En concreto, trabajo en nuestros esfuerzos de interoperabilidad con Delta Lake y Apache Iceberg.
Aniruth : Databricks unifica los datos y la IA para ofrecer a los clientes inteligencia procesable, lo que llamamos inteligencia de datos. Esto incluye la ingesta de grandes cantidades de datos, ETL, almacenamiento a gran escala, consultas de inteligencia empresarial y cargas de trabajo de IA. Las técnicas utilizadas en el aprendizaje automático en la última década existen desde la década de 1980; el auge del big data hizo posible ejecutar algoritmos a escala.
Técnicas como el método de pocos disparos o RAG dependen de datos de alta calidad. Los modelos que tienen mejores datos ganan frente a aquellos con mejores arquitecturas. Databricks ha invertido mucho en liderar los esfuerzos en el espacio de los datos, siendo pionero en la arquitectura de lagos con formatos de datos abiertos y gobernanza abierta, donde los clientes pueden obtener los mejores conocimientos con el mejor rendimiento de los lagos de datos.
Utilizamos modelos de IA de diversas formas en el producto, como Llama 3 para el Asistente de IA. Creemos en un ecosistema de IA y datos abiertos y alentamos a nuestros clientes a utilizar cualquier modelo que elijan. Ayudamos a garantizar que los clientes tengan una gobernanza de extremo a extremo en todo el ciclo de vida de la IA, independientemente de los modelos que utilicen, para que puedan concentrarse en hacer que sus modelos estén diseñados específicamente para sus casos de uso.
Hemos dedicado un esfuerzo e inversión importantes a priorizar la precisión y las respuestas imparciales para el uso de IA en nuestros productos, y seguimos realizando pruebas frecuentes.
El espacio de los datos y la inteligencia artificial está evolucionando rápidamente, por lo que es muy importante mantenerse actualizado. Mi día puede incluir hablar con clientes, realizar análisis de mercado, elaborar un documento de requisitos de productos o preparar materiales de marketing. Mi parte favorita es hacer diagramas que ilustren cómo funcionarán las cosas, ya que es bastante divertido transformar una idea en algo visual.
Pronto se producirán muchos avances importantes. Uno que me interesa especialmente es la hiperpersonalización del contenido. Durante la última década, los anuncios se han adaptado a un espectador específico. Se han adaptado algunos elementos del contenido, como la miniatura que Netflix muestra al usuario, pero no el contenido real (el vídeo en sí). Será interesante ver cómo los directores y productores logran un equilibrio entre contar la historia que quieren contar y los intereses del usuario.
Trabajo con almacenamiento de datos a gran escala, lo que puede resultar muy confuso de entender. Tenemos varias optimizaciones de IA sobre los datos, pero a menudo surgen preguntas sobre cuándo se ejecutan estas optimizaciones, cómo funcionan, qué no cubren, etc. Con este tipo de preguntas, es importante asegurarnos de que tengamos un mensaje claro y coherente sobre lo que estamos construyendo y por qué. He descubierto que explicar la causa de las limitaciones tiene muy buena acogida entre los clientes.
Los modelos multimodales van a mejorar significativamente en los próximos años, lo que cambiará nuestro modo principal de interacción con la IA. Descubrir las emociones humanas es mucho más fácil a partir de información visual o auditiva que a partir de texto. Creo que existe la oportunidad de crear interacciones más naturales en una gama más amplia de escenarios.
Por lo general, queremos ver comentarios positivos y un buen uso de nuestros productos. Hablo con los clientes con bastante frecuencia para tener una idea de cómo y por qué piensan sobre nuestros productos, lo cual es clave para explicar por qué vemos ciertas tendencias en las métricas.
Los productos de datos a gran escala son notoriamente difíciles de usar. Los ejemplos simples son fáciles de configurar, pero las cargas de trabajo de producción generalmente implican una configuración y un código confusos. Para mí, ha sido una prioridad desarrollar la funcionalidad que necesitan los clientes y, al mismo tiempo, hacer que el producto sea muy fácil de usar.
El futuro es que cualquier empresa pueda obtener información de sus datos fácilmente. En el mundo actual, la información empresarial basada en datos suele estar restringida a las empresas más grandes, pero incluso ellas preferirían una experiencia más sencilla.
En lo que respecta a las personas, estoy muy entusiasmado con las integraciones de IA en hardware. Hasta ahora, hemos visto IA en gran medida en aplicaciones de software como sitios web. Hay muchas aplicaciones más grandes de creación de dispositivos que utilizan IA, y ya estamos empezando a ver algunas de esas implicaciones en automóviles y teléfonos.
Databricks está en camino de volverse cada vez más simple y más poderoso al mismo tiempo. Estamos trabajando en muchos aspectos, desde hacer que sea fácil trabajar con datos y cálculos a gran escala hasta mejorar el rendimiento en consultas y flujos de trabajo. Personalmente, creo que pronto tendremos algunas características interesantes en todo el producto que harán que los flujos de trabajo sean mucho más fáciles con IA. Algunos ejemplos incluyen comentarios generados por IA sobre los datos, sugerencias de código de IA en los editores de cuadernos e interfaces de IA para chatear con los datos (por ejemplo, Databricks AI/BI Genie).
Existe la preocupación de si la IA reduciría la cantidad de empleos. Nuestros productos están diseñados para aumentar la información valiosa, que a menudo se obtiene en conjunto con los usuarios. Por ejemplo, con AI/BI Genie, los usuarios pueden crear interfaces con sus propios datos. Se trata de una experiencia mágica, en la que los usuarios pueden hacer preguntas y obtener respuestas específicas para ellos. De hecho, los usuarios pueden incluso comprobar el SQL que se está utilizando para confirmar que es lo que están buscando. Esto es colaborativo con los analistas, lo que reduce el tiempo que les lleva pasar de la idea a la información.
Una de las principales sorpresas que me ha sorprendido ha sido la complejidad que tienen algunas de las empresas más grandes. Esto introduce requisitos en el producto que yo no habría considerado por mi cuenta. Un ejemplo habitual es pensar en estrategias de migración al introducir un nuevo producto. Normalmente, las grandes empresas han reunido tecnologías existentes (normalmente software de código abierto) o han creado un software personalizado para resolver el problema que aborda nuestra nueva oferta de productos. Normalmente, lleva un tiempo entender por qué y cómo se combinan para garantizar que tenemos una solución que cubra todas las posibilidades.
¿Te gustaría intentar responder algunas de estas preguntas?