【详谈 Delta Lake】系列专题之基础和性能 - 03 Delta Lake DML语法 / 处理PB级数据...

作者：知新_RL | 2024-05-15 00:31:25

踩

阿里云韩宗泽

译者

韩宗泽（棕泽），阿里云计算平台事业部技术专家，负责开源大数据生态企业团队的研发工作

前言

本文翻译自大数据技术公司 Databricks 针对数据湖 Delta Lake 系列技术文章。众所周知，Databricks 主导着开源大数据社区 Apache Spark、Delta Lake 以及 ML Flow 等众多热门技术，而 Delta Lake 作为数据湖核心存储引擎方案给企业带来诸多的优势。

此外，阿里云和 Apache Spark 及 Delta Lake 的原厂 Databricks 引擎团队合作，推出了基于阿里云的企业版全托管 Spark 产品——Databricks 数据洞察，该产品原生集成企业版 Delta Engine 引擎，无需额外配置，提供高性能计算能力。有兴趣的同学可以搜索` Databricks 数据洞察`或`阿里云 Databricks`进入官网，或者直接访问以下链接进行了解：

https://www.aliyun.com/product/bigdata/spark

本系列还包括其他内容，欢迎持续关注：

第一章：基础和性能
01、Delta Lake基础：为什么可靠性和性能很重要？>>
02、深入理解事务日志 / 如何使用Schema约束和演变>>
03、（本文）Delta Lake DML语法 / 在Delta Lake中使用 Data Skipping和Z-Ordering来快速处理PB级数据
第二章：特性
第三章：Lakehouse
第四章：Streaming
第五章：客户用例

Delta Lake技术系列 - 基础和性能

（Fundamentals and Performance）

——使用 Delta Lake 为机器学习和商业智能提供可靠的数据保障

Chapter-04 Delta Lake DML（数据操作语言）

Delta Lake 支持数据操作语言（DML&

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/知新_RL/article/detail/570773

【详谈 Delta Lake】系列专题 之 基础和性能 - 03 Delta Lake DML语法 / 处理PB级数据...

Delta Lake技术系列 - 基础和性能

（Fundamentals and Performance）

Chapter-04 Delta Lake DML（数据操作语言）

【详谈 Delta Lake】系列专题之基础和性能 - 03 Delta Lake DML语法 / 处理PB级数据...