赞
踩
本篇内容为笔者数据仓库挖掘与实践的期末复习提纲范围,提纲标号为《数据仓库挖掘实践》的部分目录。
数据仓库是一个 面向主题的、稳定的、集成的、随时间变化的 数据的集合。
数据仓库系统以数据仓库为核心,将各种应用系统集成在一起,为统一的历史数据分析提供平台。通过数据分析与报表模块和分析工具OLAP(联机分析处理)、决策分析、数据挖掘完成对信息的提取,满足决策需要。
数据仓库系统通常指的是一个数据库环境
由以下3部分组成:
ETL:抽取、转换、装载。简称为数据抽取,按照统一的规则集成并提高数据的价值,是完成数据从数据源向目标数据仓库转化的过程。
操作型数据 | 分析性数据 |
---|---|
细节的 | 综合的 |
存取瞬间 | 历史数据 |
可更新 | 不可更新 |
事先可知操作需求 | 操作需求事先不可知 |
符合软件开发的生命周期 | 完全不同的生命周期 |
对性能要求较高 | 对性能要求较为宽松 |
某一个时刻操作一个单元 | 某一个时刻操作一个集合 |
事务驱动 | 分析驱动 |
细节的 | 一次操作的数据量较大 |
数据仓库 | 操作型数据库 |
---|---|
面向主题 | 面向应用 |
容量巨大 | 容量相对较小 |
数据是综合的或提炼的 | 数据是详细的 |
保存历史的数据 | 保存当前的数据 |
通常数据是不可更新的 | 数据是可更新的 |
操作需求是临时决定的 | 操作需求是事先可知的 |
一个操作存取一个数据集合 | 一个操作存取一条记录 |
数据经常冗余 | 数据非冗余 |
操作相对不频繁 | 操作较频繁 |
所查询的是经过加工的数据 | 所查询的是原始数据 |
支持决策分析 | 支持事务处理 |
决策分析需要历史数据 | 事务处理需要当前数据 |
需要复杂计算 | 鲜有复杂计算 |
服务对象为企业高层决策人员 | 服务对象为企业业务处理方面的人员 |
三种模式:星形模式,雪花模式,事实星座模式
星形模式是最基本的模式,一个星形模式有多个维表,但只能存在一个事实表。在星形模式基础上,构造维表的层结构(维表的规范化),得到雪花模式。如果打破星形模式只有一个事实表的限制,且这些事实表共享部分或全部已有维表信息,则称为事实星座模式。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。