赞
踩
① 找到核心业务流程,找到谁,在什么环节,做什么关键动作,得到什么结果。如图:
②梳理每个业务节点的客户及关注重点,找到数据在哪。
① 每个业务动作都会有数据产生。我们将能够获取到的数据,提取实体,绘制ER图,便于之后的维度建模。
② 同样以业务过程为起点向下梳理,此时的核心是业务表。把每张表中涉及的维度、指标都整理出来。
每一层采用的建模方法都不一样,其核心是逐层解耦,减少重复计算,降低烟囱式开发。越到底层,越接近业务发生的记录,越到上层,越接近业务目标。
依托数仓分层的设计理论,根据实际业务场景,我们就可以梳理出整体的数据流向图。这张图会很清晰的告诉所有人,数据从那来,到哪里去,最终提供什么样的服务。
1、数仓建设必须从业务中来,到业务中去;
2、数仓分层的目的是业务解耦;
3、无论哪种建模方式,其核心是业务实体;
4、按领域建设能快速交活,后遗症将会在2年之后爆发,且难以解决;
5、数仓建设应该把75%的时间投入到设计阶段,如果不是,那你就惨了;
6、数仓本身也可以迭代。
7、传统数仓并没有一种叫做“宽表模型”的模型,大数据时代新诞生的名词,因为很多大数据组件join代价极高。实际上是范式退化。
《数据仓库工具箱——维度建模指南》中,第二章总结了 维度设计的四个主要过程:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。