当前位置:   article > 正文

硬核数据治理体系(思维导图)

数据治理思维导图

一、数据治理体系-思维导图

5de6a5cabd230c519213eeb71e6c2282.png

a4777817d7238b80501d6fdffe03df36.png

二、元数据

2.1、元数据解决的问题

有什么数据 - 数据是什么 - 来自何处 - 如何流转 - 谁可以访问

其本质也是一种数据,,开展元数据管理工作是开展数据资产管理的基础。

2.2、元数据分类

业务元数据:描述数据系统中业务领域相关概念、关系和规则的数据;包括业务术语、信息分类、指标、统计口径等。(从业务角度描述的)

技术元数据:描述数据系统中技术领域相关的概念、关系和规则的数据;包括数据平台内对象和数据结构的定义、源数据到目的数据的映射、数据转换加工过程的描述等。

管理元数据:描述数据系统中管理领域相关概念、关系、规则的数据;主要包括人员角色、岗位职责、管理流程等信息。

2.3、元数据模型成熟度

1、第一阶段:需要手动管理元数据,即在数据治理流程外需要额外增加的步骤

2、第二阶段:在数据探查阶段自动生成元数据

3、第三阶段:自动构建数据流转元数据

6c5a9cfc3a836329bb9cab50c009ec45.png

2.4、元数据建设目标和管理手段

625b5b9323042b13e1e81c2acd9c49a4.png

2.5元数据管理

元数据管理方法:

39b31fa100cc931d4d1d4239b8f05d31.png

元数据管理能力:

d3bba814683b69804661ab19cd7cd407.png

三、数据标准

c1c4497e8995c2f5a1c8b833197ee862.png

主要构成

38d85cb7c50a665b3982e33bb41eb3e4.png

77693d26faefe26277592ffaf12f94cd.png

3.2.2、数据标准类型(举例)

不同行业的标准不同,这里仅是举例说明。

0d7f1e4390086237f409113d496e72c1.png

如:性别、身份证、金额、手机号码、行业、级别的分级分类的代码等

3.3、数据标准管理体系涉及思路

数据标准来源于业务,服务于业务。

依据已有标准进行建设

c3b739fef5fa727f5e7484b0b50794d5.png

基础类数据标准:业务化视角

指标类数据标准:从管理角度出发

b0ee7bb835a9dc202bb6446b94b9ed32.png

数据标准的指定是一个以业务管理为主导、外部要求为依据、企业现状为基础的兼容过程。

d54e9d609341278509c750496a815a85.png

3.4、数据标准架构体系

通过统一标准和架构规范,统一指标、统一术语、统一模型、统一信息项,解决数据口径解释不清晰、业务和数据理解不一致等问题,实现数据在架构层面的统一

ad596e75be5fc733f81509c7d78d11a0.png

但并非所有基础类数据都要建立标准,纳入标准的数据项需要满足共享性、重要性和可行性的准入原则。

3.5、管理类数据标准建设原则

定义:分析类数据标准的业务含义和所适用的业务场景保持一致。

口径:分析类数据标准的业务取值范围、计算方法和编码规则等业务规则保持一直。

名称:分析类数据标准中文名称和英文名称均采用统一命名规则,表示相同业务含义的信息项名称应保持一直。

参照:各分析类数据标准项标准化时参考的外部标准(包括国际标准、国家标准和行业标准),内部业务制度和业务规范应保持一致。

来源:每个分析类数据标准都应有权威的来源系统;其他系统使用该信息时应直接取用权威系统结果,以保持一致。

87fdeed4a7f8f25f0c29a24d78c18e47.png

a625337622924293a9495d9f8c7d51cf.png类似WA_* 、 WA_BASIC_*、那些

3.6、数据标准生命周期管理

9ce33d7e1712dcfa0cd7072b7713bbaf.png

四、数据建模

4.1、概念

企业级数据模型建设方法:从全局入手,涉及标准化数据模型,构建统一的数据模型管控体系,丰富和完善数据实体相关属性信息,梳理数据实体之间的逻辑关系,最终形成不同主题域数据模型。

eacc0fb4d4b636dd49ffd89a1f3eda94.png

4.2、数据模型分类

35d68591f44f2db77e432bce092493e4.png

4.3、数据模型生命周期

289641ab1421b1b1b25c66bfb11b0293.png

4.4、案例

92ae70bb8b7e2ecf8de7f21f0494e658.png

五、数据集成

5.1、概念

数据集成:主要是指基于企业分散的信息系统的业务数据进行再集中、再统一管理的过程,是一个渐进的过程,主要有新的、不同的数据产生,就不断有数据集成的步骤和方案执行。数据集成是把不同来源、格式、特点性质的数据在逻辑上或物理上有机的集中,从而为企业数据共享提供基础支撑。

a34001cf69942b241f1100b2441690ba.png

5.2、数据集成整体架构

91c38a09a9b45c54416849c4ba85b835.png

六、数据生命周期

6.1、阶段划分

3902a58c14033bbfd2629f35f46c3c2e.png

数据治理规划阶段

  • 业务规划定义阶段:业务规划、业务标准设计

  • 应用设计实现阶段:数据模型设计、应用标准设计、应用设计实现、数据录入

数据生命周期管理阶段

  • 数据创建:利用数据模型保证数据完整、执行数据标准保证数据准确、加入数据质量检查创建准确、保证数据在合理的系统生成;

  • 数据使用:利用元数据监控数据使用、利用数据标准保证数据准确、利用数据质量检查加工准确、确保数据在合理的系统使用、控制数据的派生;

  • 数据归档:利用评估手段保证归档时机、分数据类型规档数据;

  • 数据销毁:利用评估手段保证数据销毁时机,分数据类型销毁数据。

要求

  • 满足对历史数据查询相关政策和管理制度的要求

  • 满足业务操作和管理分析的需要

  • 满足审计管理要求

  • 减少数据冗余,提高数据一致性

  • 存储、硬件、运维等方面基础设施投入

  • 提升应用系统性能,提高响应速度

6.2、管理要求和手段

2de70ab74887428a38dcb1f3f8a510be.png

6.3、管理规范和管理办法

5c55852ac089f3865bb9d2e89859f76d.png

七、数据质量

7.1、数据质量管理目标

  1. 根据数据消费者的需求,开发一种满足数据质量要求的管理方法

  2. 定义数据质量控制的标准和规范,并作文整个数据生命周期的一部分

  3. 定义和事实测量、监控和报告数据质量水平的过程

  4. 根据数据消费者要求,通过改变流程和系统,以及参与可显著改善数据质量的活动,识别和倡导提高数据质量的机会

7.2、生命周期

  • 计划阶段:数据质量团队评估已知的问题范围、影响和优先级,并评估解决这些问题的备选方案。

  • 执行计划:数据质量团队负责努力解决引起问题的根本原因,并做出对持续监控数据的计划(技术问题、流程问题)。

  • 检查阶段:这一阶段包括积极监控按要求评测的数据质量。

  • 处理阶段:处理和解决新出现的数据质量问题的活动。

7.3、数据质量维度

fc7c6f30d4f2d5c9f4e23539e29578d6.png

详细见另一个文档

7.4、数据质量常用工具

095151cac8283e9bd2260bf1eca04ee8.png

八、数据开发

围绕数据价值通道(数据资产 -> 数据服务 -> 业务应用)来设计数据开发的全流程管理,推动数据价值的释放。

a8fef67af5afb814a473bce321f9f30d.png

8.1、数据资产:

e093cbab1ae16461ab7e16d26f93a397.png71d44bcaf37f8b520a8abd52221e279c.png0

8.2、数据服务:

947fe8f31ed7205f76ac8096df2c4347.png

架构:538122c4e81cb7db5c7fa4f745db42fc.png

九、数据安全

69318928bd8ce2b116560d218249253a.png

十、ETL

10.1、含义

35bfea8310ccf6b536795d99ac8988e7.png

11ca963b4b015d830e505a546d8b1797.png

4928083f160cdd349b340df4ccf3a8a7.png

10.2、ETL模式

1b604fd997b43518788fac0ad6d06f73.png

触发器模式:

ac07bfcbb12928104f399820954d6bfd.png

增量字段模式:

f4004459523413fe1919d7bc5f7d3485.png

全量同步模式:

d0c297d11a2e905cc7bb02250fef7c3b.png

日志对比模式:

f7d59e8361767db15750da1ac3677052.png

不同模式的对比:

70ea6c49aa000e708c9e3a194001e6ae.png

10.3、离线和实时

7d0e3fc85565cbd712f5c2a3c7ab7901.png52f6fe922167c149fbdb2118886ee1cb.png

d14652af6d991eba2faa8cd3811b4b78.png

66ec15736746f3867b6eab8043f428c5.png

使用场景:

3735237f0a3e3db12633d5606b5b9392.png

本文是整理来自腾讯课堂-实战数据治理的笔记,若有侵权,请联系微信yierstart删除

  1. 推荐阅读:
  2. 世界的真实格局分析,地球人类社会底层运行原理
  3. 不是你需要中台,而是一名合格的架构师(附各大厂中台建设PPT)
  4. 企业IT技术架构规划方案
  5. 论数字化转型——转什么,如何转?
  6. 华为干部与人才发展手册(附PPT)
  7. 企业10大管理流程图,数字化转型从业者必备!
  8. 【中台实践】华为大数据中台架构分享.pdf
  9. 华为的数字化转型方法论
  10. 华为如何实施数字化转型(附PPT)
  11. 超详细280页Docker实战文档!开放下载
  12. 华为大数据解决方案(PPT)
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小小林熬夜学编程/article/detail/560937
推荐阅读
相关标签
  

闽ICP备14008679号