赞
踩
面向主题的、集成的、非易失的且随时间变化的
数据集合主题(Subject)是在较高层次上将企业信息系统中的数据进行综合、归类和分析利用的一个抽象概念
每一个主题基本对应一个宏观的分析领域
在逻辑意义上,它是对应企业中某一宏观分析领域所涉及的分析对象
提取主题
采购子系统:
销售子系统:
库存管理子系统:
人事管理子系统:
数据库是为捕获和存储数据而设计
数据仓库是为分析数据而设计
数据库 | 数据仓库 | |
---|---|---|
本质 | 数据的集合 | 数据的集合 |
定位 | 事务处理OLTP | 数据分析OLAP |
面向群体 | 前端用户 | 管理人员 |
操作 | 增删改查 | 查询 |
数据粒度 | 事件记录 | 维度 |
表结构 | 3NF | 星型、雪花 |
OLTP和OLAP的区别
对比属性 | OLTP | OLAP |
---|---|---|
读特性 | 每次查询只返回少量记录 | 对大量记录进行汇总 |
写特性 | 随机、低延时写入用户的输入 | 批量导入 |
使用场景 | 用户,Java EE项目 | 内部分析师,为决策提供支持 |
数据表征 | 最新数据状态 | 随时间变化的历史状态 |
数据规模 | GB | TB到PB |
Inmon架构
Kimball架构
混合型架构
数据仓库的解决方案
数据ETL
ETL工具
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。