赞
踩
数据仓库一般拿来搭建BI平台,
BI平台分为事实表、维表,然后两种表聚合成一个宽表,其实这个宽表就是指标表。
https://blog.csdn.net/qq_28666081/article/details/104686822
一、维度表:数据仓库中的表,其条目描述事实数据表中的数据。维度表包含创建维度所基于的数据。
二、事实表:也叫事实数据表,就是app埋点日志,主要特点是含有大量的数据,并且这些数据是可以汇总,并被记录的。
在互联网行业里,就是app埋点日志!日志里前面是一些时间、机型的维度,后面是一些可汇总的度量值!
每个数据仓库都包含一个或者多个事实数据表。
事实数据表可能包含业务销售数据,如现金登记事务所产生的数据,
事实数据表通常包含大量的行。事实数据表的主要特点是包含数字数据(事实),并且这些数字信息可以汇总,以提供有关单位作为历史的数据。
每个事实数据表包含一个由多个部分组成的索引,该索引包含作为外键的相关性维度表的主键,而维度表包含事实记录的特性。事实数据表不应该包含描述性的信息,也不应该包含除数字度量字段及使事实与维度表中对应项的相关索引字段之外的任何数据。
包含在事实数据表中的“度量值”有两种:一种是可以累计的度量值,另一种是非累计的度量值。最有用的度量值是可累计的度量值,其累计起来的数字是非常有意义的。用户可以通过累计度量值获得汇总信息,例如。可以汇总具体时间段内一组商店的特定商品的销售情况。非累计的度量值也可以用于事实数据表,但汇总结果一般是没有意义的,例如,在一座大厦的不同位置测量温度时,如果将大厦中所有不同位置的温度累加是没有意义的,但是求平均值是有意义的。
一般来说,一个事实数据表都要和一个或多个维度表相关联,用户在利用事实数据表创建多维数据集时,可以使用一个或多个维度表。
举例:银行对存款记账,A表中存放实际数据,包括账号、所属机构号、存款金额等,
B表存放机构号和机构名称的对应关系。
则A是事实表,B是维表。
度量值,是跟维度放在一起说的,维度,维度的度量值。
三、宽表:
维度和指标值加起来的才叫宽表,不是把一个时间字段拆成时、分、秒拆多几个字段就叫宽表了,数据库建表没有规定多少个字段为宽啊!有些博客写的根本就是误导大家!
举个反例:
迷之误导:这人写,因为字段变多了,所以称为宽表,原来的成为窄表。???这人是来搞笑的吧。字段表多了就叫宽表?多一两个叫宽表有啥意义?
https://blog.csdn.net/weixin_42464054/article/details/92804781
百度百科的解释:
宽表从字面意义上讲就是字段比较多的数据库表。
通常是指业务主题相关的指标、维度、属性关联在一起的一张数据库表。
需要维度和指标!而不是机械得认为把维度拆多了,就叫宽表!这个说法才是对的。
https://baike.baidu.com/item/%E5%AE%BD%E8%A1%A8/19942837?fr=aladdin
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。