Votre guide définitif sur l'architecture Lakehouse avec Iceberg et MinIOpar@minio
7,295 lectures

Votre guide définitif sur l'architecture Lakehouse avec Iceberg et MinIO

2023/08/08
22m
par @minio 7,295 lectures
tldt arrow
FR
Read on Terminal Reader

Trop long; Pour lire

Apache Iceberg semble avoir pris d'assaut le monde des données. Initialement incubé chez Netflix par Ryan Blue, il a finalement été transmis à l'Apache Software Foundation où il réside actuellement. À la base, il s'agit d'un format de tableau ouvert pour les ensembles de données analytiques à grande échelle (pensez à des centaines de To à des centaines de Po). C'est un format compatible avec plusieurs moteurs. Cela signifie que Spark, Trino, Flink, Presto, Hive et Impala peuvent tous fonctionner indépendamment et simultanément sur l'ensemble de données. Il prend en charge la lingua franca de l'analyse de données, SQL, ainsi que des fonctionnalités clés telles que l'évolution complète du schéma, le partitionnement caché, le voyage dans le temps, la restauration et le compactage des données. Cet article se concentre sur la façon dont Iceberg et MinIO se complètent et comment divers cadres analytiques (Spark, Flink, Trino, Dremio et Snowflake) peuvent tirer parti des deux.
featured image - Votre guide définitif sur l'architecture Lakehouse avec Iceberg et MinIO
MinIO HackerNoon profile picture

@minio

MinIO


Credibility

react to story with heart

HISTOIRES CONNEXES

L O A D I N G
. . . comments & more!