当前位置:   article > 正文

Datahub新版本0.9.1更新,列级别数据血缘功能发布!

odd和datahub哪个好

大家好,我是独孤风。

10505ddda30b5fe21602bc78b8902325.jpeg

近期Datahub进行了一次大的版本更新,从0.9版本以后Datahub也正式发布了列级别数据血缘的功能。

0.9.1版本又增加了,列的影响分析这个功能。

b82be058e454c9d3d16c11594be59dd2.png

这样Datahub对于列级别数据血缘的功能支撑就非常完善了。

目前Datahub支持列级别数据血缘的主要功能有。

1、建立列级别数据血缘的API 2、Snowflake和Looker,Tableau的列级别数据血缘实现 3、列级别数据血缘的可视化 4、列的影响分析

eb0602ba920e0fce0bf67985926a63bd.jpeg

列级别的数据血缘非常的重要。主要是从“来”和“去”两个方向对于数据血缘进行分析。

1、理解列如何计算产生的

该列是否由敏感数据计算产生。 

计算该列数据都进行了什么运算?

2、理解该列如何被使用 

可否弃用该列,而不影响后续的指标计算。 

该列用于了哪张图表?

与Atlas的展示不同,Datahub将列血缘和数据集血缘放在了一起展示,对于数据脉络的理解也更加的清晰。

0198c441d6e4a36bf4119c829c1854e3.png

另外Datahub也发布了未来一段时间的开发计划表,值得关注的有:2022年四季度 ,实现Bigquery和Redshift 的列级别数据血缘。2023年一季度,实现对Spark的支持。

这也让我们对Datahub的未来有了更多的期待,赶紧升级用起来吧!

另外,在这几年的写作中,我也发现了除了文字以外,用视频的方式来表达可能会更加的清晰,生动,效率更高。所以我也在近期开通了大数据流动的视频号。以后也会在视频号中做一些教程,功能展示,部署演示等等作品出来。

这次的Datahub列级别数据血缘,我也做了一个简洁的视频进行介绍,不过视频制作我还是小白,也是第一次尝试配音。有不足之处还希望大家多多谅解,我会不断的改进。

也希望大家多多关注,转发。这是我坚持下去的唯一动力!

大数据流动视频号作品 《Datahub列级别数据血缘演示说明》

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/IT小白/article/detail/520896
推荐阅读
相关标签
  

闽ICP备14008679号