赞
踩
当在一定的体量企业工作后,总会遇到这样的话题:
通过这些问题我们需要找到一个方案来解决这些问题,那么便延伸出了数据仓库。
数据仓库,由数据仓库之父比尔·恩门(Bill Inmon)于1990年提出,是面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持企业管理和决策。
面向主题的:围绕主题来组织数据仓库中的数据,每个主题区域仅包含该主题相关的信息。
集成的:从不同的数据源采集数据到同一个数据源。
相对稳定的:数据装入以后一般只进行查询操作,没有传统数据库的增删改操作。
反映历史变化的:从历史的角度提供信息,关键结果都隐式或显式地包含时间元素。
说了这么多,数据仓库到底要具备什么功能呢?我们基于以上的问题转换成了业务需求:
随着大数据时代的到来,面对爆发式增长的数据,如何将这些数据有序、有结构的分类和组织存储是我们面临的一个挑战。而数据仓库理论可以将数据有序的组织和存储起来之后(即模型)。而优秀的数据仓库价值主要体现在以下几个方面:
其实,数仓在整个公司中扮演着一个承上启下的角色,本身并不会产生数据,而是从各个线上系统获取数据,按照相应的方法论进行数据建设,从而为我们的下游(决策层、运营、研发、分析师、外部厂商等)提供定制化的数据解决方案,我们需要优秀的数据模型以便能在性能、成本、质量和效率之间取得最佳的平衡。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。