赞
踩
译者
韩宗泽(棕泽),阿里云计算平台事业部技术专家,负责开源大数据生态企业团队的研发工作
前言
本文翻译自大数据技术公司 Databricks 针对数据湖 Delta Lake 系列技术文章。众所周知,Databricks 主导着开源大数据社区 Apache Spark、Delta Lake 以及 ML Flow 等众多热门技术,而 Delta Lake 作为数据湖核心存储引擎方案给企业带来诸多的优势。
此外,阿里云和 Apache Spark 及 Delta Lake 的原厂 Databricks 引擎团队合作,推出了基于阿里云的企业版全托管 Spark 产品——Databricks 数据洞察,该产品原生集成企业版 Delta Engine 引擎,无需额外配置,提供高性能计算能力。有兴趣的同学可以搜索` Databricks 数据洞察`或`阿里云 Databricks`进入官网,或者直接访问以下链接进行了解:
https://www.aliyun.com/product/bigdata/spark
本系列还包括其他内容,欢迎持续关注:
第一章:基础和性能
01、Delta Lake基础:为什么可靠性和性能很重要?>>
02、深入理解事务日志 / 如何使用Schema约束和演变>>
03、(本文)Delta Lake DML语法 / 在Delta Lake中使用 Data Skipping和Z-Ordering来快速处理PB级数据
第二章:特性
第三章:Lakehouse
第四章:Streaming
第五章:客户用例
——使用 Delta Lake 为机器学习和商业智能提供可靠的数据保障
Delta Lake 支持数据操作语言(DML&
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。