赞
踩
目录
1. 数据分析架构演进
2. Apache Paimon
3. Flink + Paimon 流式湖仓
Consumer 机制
Changelog 生成编辑
4. 设计思想
5. 核心能力
文件复用
异步 Compaction
引用材料
从传统的 Hive 和 Hadoop 数据仓库架构向 Lakehouse 架构演进,Lakehouse 架构包括 Presto、Spark、OSS 等,以及湖格式(如 Delta、Hudi、Iceberg)。 Lakehouse 架构提供了更好的操作便利性、查询效率和时效性。