赞
踩
本文隶属于专栏《大数据理论体系》,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢!
本专栏目录结构和参考文献请见大数据理论体系
Kimball 维度建模主要探讨需求分析、高层模型、详细模型和模型审查整个过程。
构建维度模型一般要经历四个阶段:
高层模型设计阶段的直接产出目标是创建高层维度模型图,它是对业务过程中的维表和事实表的图形描述。
确定维表创建初始属性列表,为每个事实表创建提议度量。
详细的维度建模过程是为高层模型填补缺失的信息,解决设计问题,并不断测试模型能否满足业务需求,确保模型的完备性。
确定每个维表的属性和每个事实表的度量,并确定信息来源的位置、定义,确定属性和度量如何填入模型的初步业务规则。
本阶段主要召集相关人员进行模型的审查和验证,根据审查结果对详细维度进行再设计。
最后,完成模型详细设计文档,提交 ETL 开发人员,进入 ETL 设计和开发阶段,由 ETL 人员完成物理模型的设计和开发。
Inmon 对数据模型的定位是:扮演着通往数据仓库其他部分的智能路线图的角色。
由于数据仓库的建设不是一蹴而就的,为了协调不同人员的工作以及适应不同类型的用户,非常有必要建立一个路线图——数据模型,描述数据仓库各部分是如何结合在一起的。
Inmon 将模型划分为三个层次,分别是
Inmon 对于构建数据仓库模型建议采用螺旋式开发方法,采用迭代方式完成多次需求。
但需要采用统一的 ERD 模型,才能够将每次迭代的结果整合在一起。
ERD 模型是高度抽象的数据模型,描述了企业完整的数据。
而每次迭代则是完成 ERD 模型的子集,通过 DIS 和物理数据模型实现。
在实践中经常会用到如下数据仓库模型层次的划分,和 Kimball 、Inmon 的模型实施理论有一定的相通性,但不涉及具体的模型表达。
赞
踩
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。