Hướng dẫn dứt khoát của bạn về Kiến trúc Lakehouse với Iceberg và MinIOtừ tác giả@minio
7,304 lượt đọc

Hướng dẫn dứt khoát của bạn về Kiến trúc Lakehouse với Iceberg và MinIO

2023/08/08
22m
từ tác giả @minio 7,304 lượt đọc
tldt arrow
VI
Read on Terminal Reader

dài quá đọc không nổi

Apache Iceberg dường như đã gây bão trong thế giới dữ liệu. Ban đầu được ươm tạo tại Netflix bởi Ryan Blue, cuối cùng nó đã được chuyển đến Tổ chức Phần mềm Apache nơi nó hiện đang cư trú. Về cốt lõi, nó là một định dạng bảng mở cho các tập dữ liệu phân tích ở quy mô lớn (nghĩ rằng hàng trăm TB đến hàng trăm PB). Nó là một định dạng tương thích với nhiều động cơ. Điều đó có nghĩa là Spark, Trino, Flink, Presto, Hive và Impala đều có thể hoạt động độc lập và đồng thời trên tập dữ liệu. Nó hỗ trợ ngôn ngữ chung về phân tích dữ liệu, SQL, cũng như các tính năng chính như tiến hóa lược đồ đầy đủ, phân vùng ẩn, du hành thời gian, khôi phục và nén dữ liệu. Bài đăng này tập trung vào cách Iceberg và MinIO bổ sung cho nhau và cách các khung phân tích khác nhau (Spark, Flink, Trino, Dremio và Snowflake) có thể tận dụng cả hai.
featured image - Hướng dẫn dứt khoát của bạn về Kiến trúc Lakehouse với Iceberg và MinIO
MinIO HackerNoon profile picture

@minio

MinIO


Credibility

react to story with heart

NHỮNG BÀI VIẾT LIÊN QUAN

L O A D I N G
. . . comments & more!