Un viaje desde los orígenes de la informática y el análisis de datos hasta lo que ahora llamamos el "Modern Data Stack". ¿Que viene despues?
Un viaje desde los orígenes de la informática y el análisis de datos hasta lo que ahora llamamos el "Modern Data Stack". ¿Que viene despues?
Los orígenes de la informática y el análisis de datos
Los orígenes de la informática y el análisis de datos comenzaron a mediados de la década de 1950 y empezaron a tomar forma con la introducción de SQL en 1970:
1954: Procesamiento del lenguaje natural (PLN) - “ Experimento Georgetown-IBM ”, traducción automática del ruso al inglés.
1960: Tarjetas perforadas
1970: Lenguaje de consulta estructurado (SQL)
Década de 1970: Sistemas interactivos de planificación financiera : creación de un lenguaje que "permita a los ejecutivos crear modelos sin intermediarios".
1972: C, LUNAR : una de las primeras aplicaciones de la informática moderna, un sistema de recuperación de información en lenguaje natural, ayudó a los geólogos a acceder, comparar y evaluar datos de análisis químicos sobre la composición del suelo y las rocas lunares.
1975: Express : el primer sistema de procesamiento analítico en línea (OLAP), destinado a analizar datos comerciales desde diferentes puntos de vista.
1979: VisiCalc : el primer programa informático de hoja de cálculo.
Década de 1980: Sistemas de apoyo a las decisiones grupales : "Sistema de trabajo colaborativo computarizado"
La "pila de datos moderna"
La "pila de datos moderna" es un conjunto de tecnologías y herramientas que se utilizan para recopilar, almacenar, procesar, analizar y visualizar datos en una plataforma basada en la nube bien integrada. Aunque QlikView era anterior a la nube, es el primer ejemplo de lo que la mayoría reconocería como un panel de análisis utilizado por plataformas modernas como Tableau y PowerBI:
1994: QlikView - “Análisis basado en panel”
2003: cuadro
2009: Wolfram Alpha - “Motor de búsqueda computacional”
2015: Power BI
2017: ThoughtSpot : "Análisis basado en búsquedas"
Papel, lenguajes de consulta, hojas de cálculo, paneles, búsqueda, ¿qué sigue?
Algunas de las aplicaciones de análisis más innovadoras, al menos en términos de experiencia del usuario, convierten el lenguaje humano en algún resultado computacional:
Texto a SQL: LUNAR, una historia tan antigua como el tiempo, se desarrolló por primera vez en los años 70 para ayudar a los geólogos a acceder, comparar y evaluar datos de análisis químicos utilizando lenguaje natural. Salesforce WikiSQL presentó el primer compendio extenso de datos creado para el caso de uso de texto a SQL, pero solo contenía consultas SQL simples. El conjunto de datos Yale Spider introdujo un punto de referencia para consultas más complejas y, más recientemente, BIRD introdujo consultas "sucias" del mundo real y puntuaciones de eficiencia para crear un punto de referencia adecuado para aplicaciones de texto a SQL.
Texto a lenguaje computacional: Wolfram Alpha, ThoughtSpot
Texto a código: análisis de datos avanzado de ChatGPT
¿Es el "análisis de datos basado en conversaciones" una evolución natural?
La experiencia de usuario de las interfaces analíticas modernas, como la búsqueda y el chat, está evolucionando y volviéndose más intuitiva, habilitada por PNL y LLM.
Las interfaces de análisis tienen su origen en permitir a los tomadores de decisiones, pero estos todavía dependen en gran medida de los analistas de datos.
Muchas consultas de quienes toman decisiones son ad hoc y se adaptan mejor a los “análisis desechables”
La generación de conocimientos es un proceso creativo en el que se obtienen muchos conocimientos en conversaciones sobre datos, posiblemente con pares.
El flujo de trabajo del análisis de datos está desarticulado , desde la imaginación del análisis hasta la presentación de los resultados.