Một hành trình từ nguồn gốc của điện toán và phân tích dữ liệu đến cái mà ngày nay chúng ta gọi là "Ngăn xếp dữ liệu hiện đại". Tiếp theo là gì?
Một hành trình từ nguồn gốc của điện toán và phân tích dữ liệu đến cái mà ngày nay chúng ta gọi là "Ngăn xếp dữ liệu hiện đại". Tiếp theo là gì?
Nguồn gốc của máy tính và phân tích dữ liệu
Nguồn gốc của điện toán và phân tích dữ liệu bắt đầu vào giữa những năm 1950 và bắt đầu hình thành với sự ra đời của SQL vào năm 1970:
1954: Xử lý ngôn ngữ tự nhiên (NLP) - “ Thử nghiệm Georgetown-IBM ”, dịch máy từ tiếng Nga sang tiếng Anh.
1960: Thẻ đục lỗ
1970: Ngôn ngữ truy vấn có cấu trúc (SQL)
Thập niên 1970: Hệ thống hoạch định tài chính tương tác - Tạo ra ngôn ngữ “cho phép các nhà điều hành xây dựng mô hình mà không cần qua trung gian”
1972: C, LUNAR - Một trong những ứng dụng sớm nhất của máy tính hiện đại, hệ thống truy xuất thông tin ngôn ngữ tự nhiên, giúp các nhà địa chất truy cập, so sánh và đánh giá dữ liệu phân tích hóa học về thành phần đất và đá trên mặt trăng
1975: Express - Hệ thống xử lý phân tích trực tuyến (OLAP) đầu tiên, nhằm phân tích dữ liệu kinh doanh từ các quan điểm khác nhau
1979: VisiCalc - Chương trình máy tính bảng tính đầu tiên
Những năm 1980: Hệ thống hỗ trợ ra quyết định nhóm - “Hệ thống làm việc hợp tác trên máy tính”
“Ngăn xếp dữ liệu hiện đại”
"Ngăn xếp dữ liệu hiện đại" là một tập hợp các công nghệ và công cụ được sử dụng để thu thập, lưu trữ, xử lý, phân tích và trực quan hóa dữ liệu trong nền tảng dựa trên đám mây được tích hợp tốt. Mặc dù QlikView đã có trước đám mây nhưng đây là ví dụ sớm nhất về thứ mà hầu hết mọi người đều nhận ra là bảng điều khiển phân tích được sử dụng bởi các nền tảng hiện đại như Tableau và PowerBI:
1994: QlikView - “Phân tích dựa trên bảng điều khiển”
2003: Hoạt cảnh
2009: Wolfram Alpha - “Công cụ tìm kiếm tính toán”
2015: PowerBI
2017: ThoughtSpot - “Phân tích dựa trên tìm kiếm”
Giấy, Ngôn ngữ truy vấn, Bảng tính, Bảng điều khiển, Tìm kiếm, tiếp theo là gì?
Một số ứng dụng phân tích sáng tạo nhất, ít nhất là về mặt trải nghiệm người dùng, chuyển đổi ngôn ngữ của con người sang một số đầu ra tính toán:
Chuyển văn bản sang SQL: Một câu chuyện đã có từ lâu đời, LUNAR được phát triển lần đầu tiên vào những năm 70 để giúp các nhà địa chất truy cập, so sánh và đánh giá dữ liệu phân tích hóa học bằng ngôn ngữ tự nhiên. Salesforce WikiSQL đã giới thiệu bản tóm tắt dữ liệu mở rộng đầu tiên được xây dựng cho trường hợp sử dụng chuyển văn bản sang SQL nhưng chỉ chứa các truy vấn SQL đơn giản. Bộ dữ liệu Yale Spider đã giới thiệu điểm chuẩn cho các truy vấn phức tạp hơn và gần đây nhất, BIRD đã giới thiệu các truy vấn “bẩn” trong thế giới thực và điểm hiệu quả để tạo điểm chuẩn phù hợp cho các ứng dụng chuyển văn bản sang SQL.
Ngôn ngữ chuyển văn bản sang tính toán: Wolfram Alpha, ThoughtSpot
Chuyển văn bản thành mã: Phân tích dữ liệu nâng cao ChatGPT
"Phân tích dữ liệu theo hướng hội thoại" có phải là sự phát triển tự nhiên không?
Trải nghiệm người dùng của các giao diện phân tích hiện đại như tìm kiếm và trò chuyện đang phát triển , trở nên trực quan hơn, được hỗ trợ bởi NLP và LLM
Giao diện phân tích có nguồn gốc từ việc hỗ trợ người ra quyết định, nhưng người ra quyết định vẫn chủ yếu phụ thuộc vào các nhà phân tích dữ liệu
Nhiều truy vấn của người ra quyết định mang tính đặc biệt , phù hợp nhất với “phân tích dùng một lần”
Tạo thông tin chi tiết là một quá trình sáng tạo trong đó thu được nhiều hiểu biết sâu sắc trong các cuộc trò chuyện về dữ liệu, có thể với các đồng nghiệp
Quy trình phân tích dữ liệu rời rạc , từ hình dung phân tích đến trình bày kết quả