当前位置:   article > 正文

数仓简介_数仓是什么样的

数仓是什么样的

1.什么是数据仓库?
一个面向主题的、继承的、相对稳定的、反应历史变化的数据集合,用于支持管理决策.

2.数据仓库的根本目的?
本质就是为了支持企业内部的商业分析和决策.
(企业的经营管理,基于数据仓库的分析结果,做出相关的经营决策)

3.数仓历史
从上世纪90年代兴起 --> 指导企业开展生产经营管理 --> 在众多企业中应用广泛

4.数仓的体系结构
在这里插入图片描述

数据源: 企业生产、经营、业务等数据,用以对企业相关经营行为进行分析;
数据存储和管理: 数据源中数据需要经过抽取、转换、加载(ETL)过程,加载到数仓中;

5.数仓与传统数据库区别
两者有本质区别, 数仓:
相对稳定 --> 数仓中数据不会频繁变化,几乎不变;
反应历史变化 --> 数仓中存储大量的历史数据,保留历史所有数据的状态(用以帮助企业构建经营分析系统<利用大量数据进行OLAP分析(多维数据分析),进而找出企业经营管理中的规律>);(区别传统数据库只存储某一时刻的数据<例如,库存管理库,商品销售出去,则可查到的数据减少一件>,不保留历史信息);

6.传统数仓面对挑战
① 无法满足快速增长的海量数据存储需求
② 无法有效处理不同类型数据(基于关系型数据库构建,只能支持结构化存储),无法存储很多类型的非结构化数据(经营日志…).
③ 计算与处理能力不足(关系型数据库纵向扩展能力有限<增加机器性能>,水平扩展能力基本没有<增加节点行不通>)

基于这些挑战,在hadoop上搭建的数仓hive,很自然的填补这些空白…

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/繁依Fanyi0/article/detail/1000828
推荐阅读
相关标签
  

闽ICP备14008679号