当前位置:   article > 正文

维度建模--如何设计事实表与维表 以及如何评估数仓模型_跨层引用率

跨层引用率

事实表有哪些特性

  • 相对于维表增长快、状态变化频繁
  • 每一个业务动作事件都可以作为一个事实,比如下单、付款发货
  • 包含外键、关联相关维度
  • 包含度量值

事实表设计方法

  • 区分/选择业务执行过程(比如商品域包括发布、上架、下架、重发 日志域包括曝光、浏览、单击 交易域包括下单、支付、发货、确认收获)
  • 声明粒度(维度属性组合表示细节程度)选择最细粒度
  • 确认维度 以事实表粒度,确定维度主键,描述业务过程环境信息
  • 确认事实 选择与业务过程相关的所有度量,粒度与声明的最细粒度一致
  • 冗余维度 提高下游使用效率,不必要的join关联

事实表分类

  1. 事务事实表 当天发生了才会有记录,不能更改(流水表)
  2. 周期快照事实表

纬度表的设计

维度:看待事实的角度,与事实表相关联
举个栗子:对于订单表来说可以分为时间角度,地域角度,品牌角度,商品种类
维度分类:
退化维度
缓慢变化未

评估数仓模型标准

1.能够覆盖尽可能多的业务场景
2.通过元数据的数据血缘可以查看到各个层级活跃表数量和读写数量,读表任务数。通过读表任务书可以看出各个任务层的读取率,如果ods的读取率超过百分之40代表中间层的复用性很差
3.从分层查询次数可以看出资源消耗程度

如何做到完善度的判断标准

</

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/从前慢现在也慢/article/detail/962912
推荐阅读
相关标签
  

闽ICP备14008679号