赞
踩
构思一个主题讨论数据仓库的构建方法论,包括数据仓库的价值、选型、构建思路,随着数据规模膨胀和业务复杂度的提升,大型企业需要构建企业级的数据仓库(数据湖)来快速支撑业务的数据化需求,与传统的数据库构建不通,数据仓库即是OLAP场景,偏于历史数据的存储/分析,用冗余存储换取数据价值;
一、数据仓库和数据库的区别
所有的应用系统都会涉及到数据库,针对数据库归纳和存放,也就是数据库的常见操作:增、删、改、查,那么为什么想要对企业数据进行分析,不能直接查询数据库,非要大费力气的去创建所谓的数据仓库和数据湖呢?
数据仓库主要是为了能够支持管理决策,而数据库是为了满足系统的及时性、一致性,好比你去银行存钱,你希望刚把钱存进去就能够查询到余额增加,你不希望第二天才能够确认,但是若是银行想对你的流水和余额进行分析,这个时候希望知道你在不同时期的银行余额,那么从数据库里是查不到你的历史余额信息的,因为数据库在设计的时候就需要满足一定的范式,为的就是满足及时性和去冗余,一个客户对应的余额只有一个,你在存款的时候,新的余额就会覆盖掉老的余额,所以你的历史信息在数据库中是没有记录的。
如果银行希望查询客户的历史信息,比如说你需要查询个人客户信息,他可能在柜台交易系统中有记录,也可以在网上银行交易系统也有记录,而你希望查询客户柜台交易信息以及网银交易信息,这个时候需要跨系统查询,有可能两个系统所使用的数据库都不一样,各自权限负责人员也不一样,跨系统查询显得非常困难,这个时候需要一个系统能够将所有业
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。