【Iceberg学习一】什么是Iceberg？_apache iceberg

作者：码创造者 | 2024-07-14 13:34:11

踩

apache iceberg

Apache Iceberg 是一个面向大型分析数据集的开放表格格式。Iceberg 为包括 Spark、Trino、PrestoDB、Flink、Hive 和 Impala 在内的计算引擎增加了表格功能，使用一种高性能的表格格式，其工作方式就像一个 SQL 表一样。

Iceberg 避免了不愉快的意外。模式演化功能正常运作，并不会无意中恢复已删除的数据。用户无需了解分区信息也能获得快速查询。

Iceberg 为庞大的表格而构建。在生产环境中，Iceberg 被用于管理单个表格可包含数十PB（千兆字节）的数据，即使是这样巨大的表格也能在没有分布式SQL引擎的情况下读取。

Iceberg 旨在解决最终一致性云对象存储中的正确性问题。

Iceberg 被设计和开发成一个开放的社区标准，拥有一个规范以确保跨语言和实现的兼容性。

Apache Iceberg 是开源的，在 Apache 软件基金会进行开发。

声明：本文内容由网友自发贡献，转载请注明出处：【wpsshop博客】