赞
踩
dama 模拟题
1 数据仓库建设涉及两种主要的数据集成处理类型。请从下列选项中选择关于这两种集成处理描述正确的选项。
A. 历史数据加载和持续不断的数据更新
B. ETL和ELT
C. 批量加载和实时加载,
D. 批流分离的加载和批流一体的加载
2 CMMI(能力成熟度模型研究所)开发了CMM-DMM(数据管理成熟度模型),以下哪项不属于CMMI数据管理领域提供的评估标准。
A. 数据管理策略 B. 数据模型 C. 数据支持流程 D. 数据操作
3 某公司为提高公司产品销量,推出了一项新的促销活动,在给客户发送促销短信,告知客户活动信息时发现,部分客户信息在联系电话-栏为空,以上数据质量问题归属于哪种数据质量维度?
A. 合理性 B. 一致性 C. 准确性 D. 完备性
4 数据湖是一种可以提取、存储、评估和分析不同类型和结构海量数据的环境,可供多种场景使用。请从下列选项中选择一项数据湖使用的场景。
A. 数据湖不可以用来当作数据仓库明细历史数据的备用存储区域
B. 数据湖不可以用来存储非结构化的数据,但可以存储各种结构化的数据
C. 数据湖无法处理流数据
D. 数据湖可以当作原始数据的集中存储区域,不需要或者只需很少量的转换
5 下列哪项不属于数据管理成熟度评估报告结果:
A. 评估的总体结果
B. 项目进展中的风险
C. 可在组织内使用或重复使用的组件
D. 投资的预期收益及节约项目成本
6 按照DAMA的观点,数据管理专员属于哪种角色?
A. 混合角色 B. 业务角色 C. 复合型角色 D. IT角色
7 愿景可以是平凡而简单的,不必宏伟或包罗万象。愿景是变革工具和变革过程体系中的一项要素。与该体系中还包含的战略、计划、预算等相比,愿景是一个非常重要的因素。它要求团队专注于切实的改进。请从下列选项中选择关于有效愿景的特征正确的描述。
A. 愿景必须普适,不允许个人采取主动或者灵活性
B. 愿景不一定非得具有吸引力
C. 愿景不必充满想象,但需要能切合实际
D. 愿景必须具有可交流性。容易在5分钟或者更短时间内分享和清晰交流
8 关于在线分析处理(OLAP),下列哪个描述是不正确的?
A. 混合型联机分析处理(HOLAP).它是ROLAP和MOLAP的结合
B. 多维矩阵型分析处理(M OLAP)通过使用专门的多维数据库技术支持OLAP
C. 关系型联机分析处理(ROLAP).ROLAP通过在关系数据库(RDBMS)的二维表中使用多维技术来支持OLAP
D. 星型设计和雪花设计是在线交易处理(OLTP)环境中常用的数据库设计方法
9 无论数据管理组织的架构如何,有10个因素始终被证明对其数字化转型的成功发挥着关键作用。请从下列选项中选择一个不属于这10个因素的选项。
A. 革命而非演进 B. 高管层的支持 C. 主动的变更管理 D. 明确的愿景
10 2014年,Data versity发布了概述CDO常见任务的研究。下列哪一项一般而言最有可能是CDO的任务?
A. 建立组织的数据战略
B. 决策是否上云
C. 指导和命令T部门的相关工作必须和业务目标保持一致
D. 决策购买哪种数据库软件系统
11 请从下列选项中选择关于元数据管理工作度量指标描述正确的选项。
A. 元数据存储库完整性 B. 元数据技术选型 C. 元数据的备份 D. 元数据存储库的能
12 下列哪一项是数据仓库建设应遵循的指导原则?
A. 以终为始 B. 全局性的思考和设计 C. 以上都是 D. 聚焦业务目标
13 数仓和B1建设的度量指标包括了多种。请从下列选项中选择不属于该度量指标的选项。
A. BI产品的功能
B. 响应时间和性能指标
C. 使用指标。包括注册用户数、连接用户数或并发用户数
D. 主题域覆盖率
14 请从下列实体中,选择不是可以独立存在的实体
A. 商品 B. 客户 C. 账户 D. 职业
15 数据科学家开展工作依赖于哪些要素?
A. 丰富的数据源 B. 以上全部 C. 信息组织和分析 D. 展示发现和数据洞察
16 当人们认为没必要做某件事的时候,他们会找到成干上万种不合作的理由。要想激励足够多的关键人员支持变革,就必须让人们有清晰而令人信服的紧迫感。请从下列选项中选择关于紧迫感正确的描述。
A. 按照科特的观点,紧迫感应该保持在90%以上
B. 与紧迫感相反的是谦虚
C. 在极少数情况下,面对组织的自满情绪,组织中的个人可以取得一些可持续的进展
D. 紧迫感来自于多种因素,比如,监管变化、业务连续性风险、商业策略的改变等
17 管理和掌握元数据对组织具有非常重要的意义,请从下列选项中选择关于元数据管理的作用描述不正确的选项。
A. 元数据可以帮助组织理解自身的数据、系统和流程
B. 元数据可以帮助用户评估数据质量、对数据库与应用程序的管理来说是不可或缺的
C. 元数据可以帮助组织预判数据资产的价值
D. 元数据可以帮助处理、维护、集成、保护和治理其他数据
18 请从下列选项中选择关于有效的数据质量指标的选项。
A. 技术相关性 B. 定性或者定量 C. 趋势分析 D. 愿景性的,而不一定需要大家都可接受的
19 根据DMBOK2,以下关于数据湖的描述,不正确的选项是哪个?
A. 为了建立数据湖中的内容清单,在数据被摄取时对数据质量进行管理至关重要
B. 数据湖是一种企业数据架构方法,用来集中化存储企业内海量的、多来源、多种类的数据,并支持对数据进行快速加工和分析
C. 数据湖的风险在于,它可能很快会变成数据沼泽一杂乱、不干净、不一致
D. 数据湖可以作为Hadoop或其他数据存储系统、集群服务、数据转换和数据集成等数据处理工具的一种复合配置来实施
20 PDCA作为提升数据质量的方法,在什么情况下需要开始一个新的周期。请从下列选项中选择正确的答案。
A. 现有测量值高于阈值
B. 新数据集还没加载进来
C. 业务规则、标准或期望没有变更
D. 对现有数据集提出新的数据质量要求
21 数据显示某人的年龄为180岁。这个数据很有可能有问题,需要进步核实。这违反了数据质量的哪个维度指标?
A. 合理性 B. 一致性 C. 准确性 D. 及时性
22 在数仓和BI建设中,数据的自助服务是商务智能产品的基本交付方式。它通常会将用户活动放在受管门户中,根据用户的权限提供各种功能。这些功能不包括下列哪一项?
A. 仪表盘和计分卡功能
B. 报表可以按标准计划推送到门户,供用户在空闲时检索
C. 数据的自动汇集
D. 消息传递、警报、查看预定的生产报表、与分析报表交互、开发即席查询报表
23 请从下列选项中选择关于元模型描述正确的选项。
A. 元模型中代码集、代码域、代码值、代码业务含义等属于业务元数据
B. 元模型是创建元数据存储库的数据模型
C. 元模型不分概念模型、逻辑模型、物理模型
D. 元模型中的最小单位是代码
24 请从下列选项中选择关于元模型描述正确的选项。
A. 数据入湖后,可以半年后再对采集的数据进行编目,以便以后访问
B. 需要收集关于在数据湖中采集的每个对象的最小元数据属性集(如名称、格式、来源、版本、接收日期等),这将生成数据湖内容的目录
C. 如果没有把数据湖中的元数据管理好,数据湖就会成为数据池塘
D. 非结构化数据的元数据管理与传统的结构化数据的元数据管理没有差别
25 各组织进行能力成熟度评估基于什么原因?
A. 监管对数据管理提出的最低要求
B. 提高数据管理水平,找到改进的建议
C. 数据治理
D. 以上都正确
26 请从下列选项中选择导致数据质量问题的最首要的常见原因。
A. 系统设计引起的问题
B. 数据输入过程引起的问题
C. 数据处理功能引起的问题
D. 领导不重视和企业文化不到位
27 数据剖析是一种用于检查数据和评估质量的数据分析工具,请选择关于数据剖析描述不正确的选项。
A. 剖析的内容有空值、最大/最小值、单个列值的频率分布等
B. 剖析引擎生成统计信息,分析人员可以使用这些统计信息识别数据内容和结构中的模式
C. 数据剖析使用统计技术来发现数据集合的真实结构、内容和质量
D. 数据剖析必须基于大数据平台技术才能实现
28 元数据的来源有哪些?
A. 业务术语表,数据字典,数据库目录、BI工具,但不包括数据字典。数据字典是由数据库自身维护的
B. 业务术语表,数据字典,数据库目录、B工具等
C. 业务术语表,数据字典,数据库目录、但不包括BI工具
D. 数据字典,数据库目录、BI工具等,但不包括业务术语表
29 请从下列选项中选择关于元数据定义描述不正确的选项。
A. 元数据包括技术和业务流程、数据规则和约束、逻辑数据结构与物理数据结构等
B. 元数据与数据不同,是一类特殊的数据,不具备数据的通用属性和特征
C. 元数据是关于数据的数据
D. 元数据描述数据本身,数据表示的概念,数据与概念之间的关系
30 批量变更数据捕获(CDC,如何识别变量)一直不是一件容易的事。一般而言下列哪项是可能的方法之一?
A. 通过加载用户名来识别
B. 通过建立日志表来识别
C. 主数据管理 D. 全量加载
31 根据DMBOK2,以下关于数据和文本挖掘的描述,错误的是:
A. 数据挖掘是一种特殊的分析方法,它使用某一种特定算法揭示数据中的规律
B. 文本挖掘使用文本分析和数据挖掘技术来分析文档,将内容自动进行分类,成为工作流导向和领域专家导向的知识本体
C. 数据挖掘最初是机器学习的一个分支,属于人工智能的一个子领域
D. 数据挖掘工具通过揭示规律来帮助发现未知的关系
32 关于CRUD和RACI,以下哪项描述是正确的?
A. CRUD表示负责、批注、咨询、通知
B. RACI表示创建、读取、更新、删除
C. RACI和CRUD是一样的,无非是两种不同的的表达
D. RACI是关于责任,而CRUD是关于权限
33 以下哪个岗位代表所有相关方的利益?
A. 数据科学家
B. 数据管理专员/数据管家
C. 数据Owner
D. CDO首席数据官
34 按照DMBOK2,元数据有多种类型。请从下列选项中选择关于元数据分类正确的选项。
A. 管理元数据
B. 操作元数据
C. 描述元数据
D. 结构元数据
35 请选择关于元数据管理描述正确的选项。
A. 与其他数据不一样,元数据是关于数据的数据,元数据本身不需要管理
B. 要实现数据驱动,组织必须先实现元数据驱动
C. 随着组织收集和存储数据能力的提升,元数据在数据管理中的作用就会变得越来越不重要
D. 元数据管理不需要考虑元数据的质量问题
36 根据DMBOK2,数仓和数据科学有不同的侧重点。请从下列选项中选择描述正确的选项。
A. ETL数据科学侧重预测,相对应的数据加载一般是ELT
B. 数据科学侧重报表,相对应的数据加载一般是ETL
C. 数仓侧重报表,相对应的数据加载一般是ELT
D. 数仓侧重预测,相对应的数据加载一般是
37 Kimball的多维数据仓库是数据仓库开发的一种主要模式。下列哪项是对他的多维模型正确的描述?
A. 多维模型由事实表、链接表、和维度表组成
B. 数据集市是必须的
C. 多维模型通常称为星型模型
D. ODS层是必须的
38 在数仓建设中,许多数据集成工具提供血缘分析。记录的数据血缘关系有很多用途。请从下列选项中选择关于数据血缘关系描述不正确的选项。
A. 通过血缘关系可以调查数据问题的根本原因
B. 通过血缘关系可以对系统变更或数据问题进行影响分析
C. 通过血缘关系可以根据数据来源确定数据的可靠性
D. 通过血缘关系可以分析数据的质量和安全系数
39 数据科学的过程包括多个阶段。请从下列选项中选择工作量最大的阶段。
A. 定义战略和业务需求
B. 收集和整合数据
C. 数据建模
D. 选择数据源
40 在关系型数据建模过程中,表结构之间的关系可以有多种。如下哪个表述是正确的?
A. 可以是“多对多”的关系,但不可以是“一对多”的关系或者“多对一”的关系
B. 可以是“一对多”的关系,但不可以是“多对一”的关系
C. 可以是“多对一”的关系,但不可以是“一对多”的关系
D. “多对多”的关系是应该避免的
41 请从下列选项中选择不属于元数据管理目标的选项。
A. 记录和管理与数据相关业务术语的知识体系,以确保人们理解和使用数据内容的一致性
B. 通过增加成本和延长项目周期,提升数据质量,降低培训成本和员工流动影响。
C. 确保原数据的质量、一致性、及时性和安全
D. 收集和整合来自不同来源的元数据,以确保人们了解来自组织不同部门的数据间相似与差异
42 常见的数据管理成熟度模型有:
A. DAMA的数据质量框架模型
B. EDM Council的数据管理成熟度模型
C. 阿姆斯特丹模型
D. 战略一致性模型
43 请从下列选项中选择不属于元数据的选项。
A. 数据模型,数据质量规则和检核结果
B. 标签
C. 数据CRUD(增、查、改、册)规则
D. 服务水平协议(SLA)要求和规定
44 关于数据质量的评估维度,有几位最有影响力的专家。请从下列选项中选择其中一位。
A. Larry English
B. John Kotter
C. William Bridges
D. Peter Aiken
45 各组织进行能力成熟度评估有诸多因素,以下哪个原因是错误的?
A. 组织认识到要改进其实践过程应从评估其当前状态开始
B. 法律法规的限制
C. 技术的进步提供了管理和使用数据的新方法
D. 出于规划与合规性目的,数据治理需要进行成熟度评估
答案
1 A 参考书本299页
2 B 参考书本420页,变种题,老题的错误选项是“数据隐私与安全”
3 D 暂无解析
4 D 参考书本392页
5 D 参考书本424~425页
6 B 参考书本448页
7 D 参考书本467页,变种题,记住没有经济利益性,没有量化性,没有未来性
8 D 参考书本311页,其实不算变种题,和往期有一题概念上一摸一样,就是表达方式做了微调,错误选项都是选“星型设计和雪花设计是在线交易处理(OLTP)环境中常用的数据库设计方法”
9 A 参考书本439页,有多个变种题,建议有时间多看439页10个因素
10 A 参考书本444页,变种题,可能改为选错误的,选“决策是否上云”,另外三个都是正确的。
11 A 参考书本343页,变种题为选不正确的选项“元模型和血缘关系建设和应用的情况”
12 C 参考书本291~292页,变种题,注意有可能“以终为始”故意写反成“以始为终”然后让你选错的。
13 A 暂无解析
14 C 98页有关于实体的解释,账户的存在需要依赖于其他实体的存在,例如,开设账户的时候必须依赖于客户,不存在没有客户的账户。
15 B 暂无解析
16 D 参考书本460~461页
17 C 参考书本320页上方
18 C 参考书本378页
19 A “参考书本392页,
“数据湖的风险在于,它可能很快会变成数据沼泽一杂乱、不干净、不一致”,
“数据湖可以作为Hadoop或其他数据存储系统、集群服务、数据转换和数据集成等数据处理工具的一种复合配置来实施”
以上两个均有原文
“为了建立数据湖中的内容清单,在数据被摄取时对数据质量进行管理至关重要”错在应该对元数据进行管理而不是数据质量
“数据湖是一种企业数据架构方法,用来集中化存储企业内海量的、多来源、多种类的数据,并支持对数据进行快速加工和分析”查百度有原文支持”
20 D 参考书本358页
21 A 参考书本353~354页,准确性和合理性的解释
22 C 参考书本312页
23 B 参考书本335页
24 B 参考书本326页
25 D 参考书本416页,“提高数据管理水平,找到改进的建议”选项非原文,基本是对的,故选“以上都正确”
26 D 参考书本359~360页,变种题,请记住引起数据质量问题的5个原因,可能会有“领导不重视和企业文化不到位”选项,以上都对。
27 D 参考书本362~363页
28 B 参考书本326~330页,元数据来源15点全部记下来。变种题,可能三个都是正确答案,就选“以上都是”
29 B 参考书本320页上方
30 B 书本300页,全量加载太费时间,一般不会选
31 A 参考书本394~395
32 D 参考194页和197页
33 B 参考书本50页
34 B 参考书本324~325页,此题4个选项均为正确选项,出题人应该是片面的采用了324页上方信息技术领域外的元数据类别,因为最佳选项只能是“操作元数据”,如果出题人发现此异常,应该修改题干为“技术领域外的元数据分类”或者修改一个确实不存在的元数据类型,请考生随机应变
35 B 参考书本321页上方
36 A “数仓侧重报表,相对应的数据加载一般是ELT
ETL数据科学侧重预测,相对应的数据加载一般是ELT
只有上述两个选项可用,而数仓肯定是用ETL,所以只能选“ETL数据科学侧重预测,相对应的数据加载一般是ELT””
37 C “参考书本296页
“数据集市是必须的”和“ODS层是必须的”没有原文支持,
“多维模型由事实表、链接表、和维度表组成”多了一个链接表,
“多维模型通常称为星型模型”正确。变种题,有可能三个选项都是正确的,唯一一个错误选项是ODS层是必须的”
38 D 参考书本308页,此题是CDMP国际认证专项考试元数据的一道原题
39 B 这题是CDMP的题目,少了一个清洗的选项,属于DII范围,因此选:“收集和整合数据”
40 D 一般建模都不会有多对多,属经验
41 B “参考书本322页下方目标5小点。注意:根据4个选项的理解来看,
“确保原数据的质量、一致性、及时性和安全”选项的“原数据”应该是出题人输入错误,而非错误选项,
因为“通过增加成本和延长项目周期,提升数据质量,降低培训成本和员工流动影响。”错的更加明显。变种题,正确选项变化,但是错误选项没变,还是选“通过增加成本和延长项目周期,提升数据质量,降低培训成本和员工流动影响。””
42 B 参考书本416页,数据管理成熟度模型有4个,必须都记住CMMI的DMM模型,EDM委员会DCAMI,IBM,斯坦福参考书本420页,数据管理成熟度模型有4个,必须都记住CMMI的DMM模型,EDM委员会DCAMI,IBM,斯坦福
43 B 暂无解析
44 A 参考书本350~352页,此题有一个题干不同的类似题,建议大家把行业内的几个专家名字都记住,Strong-Wang、Thomas Redman、Larry English、DAMA,其他都是错的
45 B 参考书本416页
最后祝大家在 2024 -6月以后考试考出好成绩
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。