赞
踩
国际数据管理协会(DAMA)给出的定义:数据治理是对数据资产管理行驶权力和控制的活动集合。
数据治理的最终目标是提升数据的价值,数据治理非常必要,是企业实现数字战略的基础,它是一个管理体系,包括组织、制度、流程、工具。本文重点从一个数据开发的角度上对数据治理做相应的措施。
数据治理就是通过有效的手段对数据开发的全生命流程进行管控数据规范化、提升数据质量的所有活动,都是为了提升数据资产、提升数据价值。数据治理的最终目的是为了解决机器资源(存储资源跟计算资源)、人力资源,沉淀数据资产。
本文主要聚焦于数据仓库开发相关的数据治理。在整个数据仓库开发的过程中,自始至终都会包含两个部分,一部分是数据仓库内部的自身建设;一方面是对接外部的数据需求。两者在整个数据仓库架构设计、开发落地中都是相辅相成的。
在数据仓库建设初期,数仓公共层、标准层没有建设完成,为了快速响应业务需求,会直接从ods层表直接开发,数据开发的规范化、标准化未能及时落地,会造成很多后期需要优化的任务作业以及表;开发中期,新的业务需求跟初期设计的模型进行不断地融合,需要对数据模型不断地优化设计;在数仓开发后期,我们会对数据存储大、小文件多、占用计算资源多、计算时间长的任务进行集中优化。
一、按照开发流程来说,我们将数据分为以下几个阶段:
二、按照治理策略方面,可以分为以下:
三、按照治理方向,可以分为以下几点:
数据治理是要贯穿整个数据仓库的设计开发全流程的,数据治理也不是能一步到位的,在我们不断对业务了解、数据了解、需求了解后,不断的优化迭代,设计开发出适合自己业务的数据仓库才是最好的。数据治理是一个不断雕刻的过程,有点类似代码重构,只有不断的将数据跟业务融合,才能不断的提升数据服务,体现数据仓库价值。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。