赞
踩
今天来填 2 个月前的坑。之前提到了数据质量:
我在面试中也碰到了数据质量的问题,没回答出来。今天学习一下数据质量监控原则。欢迎点击此处关注公众号。
数据质量的高低代表了该数据满足数据消费者期望的程度,这种程度基于他们对数据的使用预期,只有达到数据的使用预期才能给予管理层正确的决策参考。数据质量管理作为数据仓库的一个重要模块,主要可以分为数据的健康标准量化、监控和保障。
一张表的记录数在一个已知的范围内,或者上下浮动不会超过某个阈值。
监控的指标:日活、周活、月活、留存(日周月)、转化率(日、周、月)、GMV(日、周、月)。
例如:平常复购率(日周月)大约 30%,某天检测发现只有 20%。
某个字段为空的记录数在一个范围内,或者占总量的百分比在某个阈值范围内。
一个或多个字段没有重复记录。
一个或多个字段是否满足某些规则。
主要针对同步流程,监控两张表的数据量是否一致
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。