当前位置:   article > 正文

大数据技术【6】_大数据分析技术题

大数据分析技术题

1.以下关于大数据可视化的说法,不正确的是()(2分)

A.大数据可视化利用计算机图形学和图像处理技术,将数据转换为图形或图像在屏幕上显示出来,并进行各种交互处理的理论、方法和技术
B.能够把抽象、枯燥或难以理解的内容,包括看似毫无意义的数据、信息、知识等等以一种容易理解的视觉方式展示出来
C.涉及到计算机图形学、图像处理、计算机视觉、计算机辅助设计等多个领域,成为研究数据表示、数据处理、决策分析等一系列问题的综合技术
D.对多维数据进行切片、块、旋转等动作剖析数据,从而多角度多侧面观察数据

2.大数据分析在分析效果上更追究效率而不是绝对精确。(2分)

4.最早提出大数据时代概念的公司是()。(2分)

A.微软公司
B.谷歌公司
C.脸谱公司
D.麦肯锡公司

5.数据清洗的方法有缺失值处理、噪声数据清除、一致性检查等。(2分)

6.数据从产生到被删除销毁的过程中,具有多个不同的数据存在阶段。(2分)

7.Apriori方法通常用于关联规则挖掘。。(2分)

8.原始数据集来自多个数据库或数据仓库,它们的结构和规则是相同的。(2分)

9.MapReduce任务过程分为两个处理阶段:map阶段和()阶段。。(2分)

A.map
B.reduce
C.Map/Reduce
D.master

10.当前大数据技术的基础是由谷歌首先提出的。(2分)

11.下面哪一项不属于大数据系统的必备要素()。(2分)

A.云平台
B.物联网
C.数据
D.数据库

12.以下哪个属于非关系型数据库()。(2分)

A.Mysql
B.Access
C.SQL
D.MonogoDB

13.以下哪个选项是目前利用大数据分析技术无法进行有效支持的()。(2分)

A.新型病毒的分析判断
B.精确预测股票价格
C.个人消费习惯分析及预测
D.天气情况预测

14.()是目标类数据的一般特性的汇总,通常以用户指定类的数据通过数据库查询收集,其输出可以用多种形式呈现,例如饼图,条形图,折线图等等。(2分)

A.数据属性
B.数据整合
C.数据采集
D.数据特征

15.大数据的6V特征中,Volume表示()(2分)

A.大量
B.多样
C.低价值密度
D.高速

16.以下哪些算法是分类算法()。(2分)

A.DBSCAN
B.C4.5
C.K-Means
D.EM

17.决策树是一种基于树形结构的预测模型,每一个树形分叉代表一个分类条件,叶子节点代表最终的分类结果,其优点在于易于实现,决策时间短,并且适合处理非数值型数据。(2分)

18.大数据分析时,在分析方法上更注重相关分析而不是因果分析。(2分)

19.关联规则分析可用于分析顾客消费,以便有针对性的向其推荐感兴趣的服务。(2分)

20.聚类分析时不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别。(2分)

21.大数据分析中,在数据基础上倾向于典型抽样数据。(2分)

22.人们关心大数据,最终是关心大数据的应用,关心如何从业务和应用出发让大数据真正实现其所蕴含的价值,从而为人们生产生活带来有益的改变。(2分)

23.K-means算法是有监督学习。(2分)

24.大数据最显著的特征是数据价值密度高。(2分)

25.数据可视化中实现中数据映射指的是()(2分)

A.从数据源中选取有效数据
B.确定数据到标记和视觉通道的映射
C.视图的选择与用户交互控制的设计
D.概括现实生活中用户遇到的问题

26.在不同的数据存在阶段,数据的价值是不同的。(2分)

27.数据分析前要对数据进行预处理。(2分)

28.利用数据融合、数学模型、仿真技术等,可以逼近事物的本质,可以揭示出原来没有想到或难以展现的关联,大大提升政府决策的科学性。(2分)

29.数据仓库是面向业务的,支持联机事务处理。(2分)

30.可用作数据挖掘分析中的关联规则算法有()。(2分)

A.决策树
B.K均值法
C.Apriori算法
D.线性回归

31.()是在已知各种情况发生概率的基础上,通过构成树状结构来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。(2分)

A.生成树
B.决策树
C.哈夫曼树
D.文本树

32.Apriori算法是无监督学习。(2分)

33.数据的不确定性的产生原因不包括()。(2分)

A.数据采集与传输
B.数据精度转换
C.缺失值处理
D.数据特征描述

34.以下说法不正确的是()。(2分)

A.分类是预测数据对象的离散类别。
B.预测是用于数据对象的连续取值。
C.Apriori算法是一种典型的关联规则挖掘算法。
D.决策树方法通常用于关联规则挖掘。

35.大数据会带来机器智能。(2分)

36.下列关于MapReduce说法不正确的是()。。(2分)

A.MapReduce是一种计算框架
B.MapReduce来源于google的学术论文
C.MapReduce程序只能用Java语言编写
D.MapReduce隐藏了并行计算的细节,方便使用

37.大数据还是一种思维方式。(2分)

38.Hadoop是一个由Apache基金会所开发的分布式系统基础架构。(2分)

39.大数据一般是指数量级为GB以上的数据。(2分)

40.数据仓库可支持决策。(2分)

41.大数据的应用可以促进健康管理的个性化和多元化。(2分)

42.以下说法正确的是()。(2分)

A.原始数据集来自多个数据库或数据仓库,它们的结构和规则是相同的。
B.孤立点在数据挖掘时总是被视为异常、无用数据而丢弃。
C.可信度是对关联规则的准确度的衡量。
D.聚类是指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的过程。

43.决策树方法通常用于关联规则挖掘。(2分)

44.计算机数据存储的容量单位,1KB<1MB<1GB。(2分)

45.大数据还是一种思维方式和新的管理、治理路径。(2分)

46.大数据分析之前首先要进行抽样分析。(2分)

47.下列关于网络用户行为的说法中,错误的是()。(2分)

A.网络公司能够捕捉到用户在其网站上的所有行为
B.用户离散的交互痕迹能够为企业提升服务质量提供参考
C.数字轨迹用完即自动删除
D.用户的隐私安全很难得以规范保护

48.谷歌流感趋势预测充分体现了数据重组和扩展对数据价值的重要意义。(2分)

49.数据再利用可挖掘数据的潜在价值。(2分)

50.用户离散的交互痕迹能够为企业提升服务质量提供参考。(2分)

51.在采集数据时要注意用户的隐私安全问题。(2分)

52.文档型(MonogoDB)数据库是关系数据库。(2分)

53.现在非结构化数据大约占人类数据总量的25%。。(2分)

54.以下哪个不是决策树的算法()。(2分)

A.ID3
B.C4.5
C.CART
D.Prim

55.大数据的(),指的是数据有很多不同形式(文本、图像、视频、机器数据),无模式或者模式不明显、且语法或句义不连贯。(2分)

A.大量性
B.多样性
C.低价值密度
D.高速

56.大数据通常是指GB级以上的数据。(2分)

57.()是考察多个变量间相关性一种多元统计方法,研究如何通过少数几个主成分来揭示多个变量间的内部结构,即从原始变量中导出少数几个主成分,使它们尽可能多地保留原始变量的信息,且彼此间互不相关。(2分)

A.指数分析
B.回归分析
C.预测分析
D.主成分分析

58.网络公司能够捕捉到用户在其网站上的所有行为,并进行数据分析及挖掘。(2分)

59.大数据的6V特征中,Variety表示()(2分)

A.大量
B.多样
C.低价值密度
D.高速

60.以下哪个不属于大数据可视化的应用()。(2分)

A.医学影像
B.天气云图
C.热点地图
D.响应式表单

61.大数据技术可应用于金融、互联网、公共管理等不同的领域。(2分)

62.判断题\:数据仓库是一切商业智能系统的基础。(2分)

63.大数据分析中,在分析效果上追究精确性。(2分)

64.下列关于MapReduce说法不正确的是()。。

A.MapReduce是一种计算框架
B.MapReduce来源于google的学术论文
C.MapReduce隐藏了并行计算的细节,方便使用
D.MapReduce程序只能用Java语言编写

65.BIRCH是一种()。

A.分类器
B.聚类算法
C.关联分析算法
D.特征选择算法

66.分析顾客消费行业,以便有针对性的向其推荐感兴趣的服务,属于()问题。

A.聚类分析
B.分类与回归
C.关联规则挖掘
D.时序预测

67.以下说法正确的是()。

A.原始数据集来自多个数据库或数据仓库,它们的结构和规则是相同的。
B.孤立点在数据挖掘时总是被视为异常、无用数据而丢弃。
C.聚类是指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的过程。
D.可信度是对关联规则的准确度的衡量。

68.SVM可以通过核方法(kernelmethod)进行非线性分类。

69.()分析又称为变异数分析,主要用于两个及两个以上样本均数差别的显著性检验。

A.回归分析
B.方差分析
C.相关分析
D.因子分析

70.大数据的本质是()。

A.挖掘
B.洞察
C.联系
D.搜集

71.MapReduce任务过程分为两个处理阶段:map阶段和()阶段。。

A.Map/Reduce
B.reduce
C.master
D.map

72.()是考察多个变量间相关性一种多元统计方法,研究如何通过少数几个主成分来揭示多个变量间的内部结构,即从原始变量中导出少数几个主成分,使它们尽可能多地保留原始变量的信息,且彼此间互不相关。

A.指数分析
B.回归分析
C.主成分分析
D.预测分析

73.电商网站上的"猜你喜欢”实际上是基于()原理。

A.物联网
B.数据仓库
C.推荐系统
D.网络爬虫

74.以下关于大数据可视化的说法,不正确的是()

A.大数据可视化利用计算机图形学和图像处理技术,将数据转换为图形或图像在屏幕上显示出来,并进行各种交互处理的理论、方法和技术
B.涉及到计算机图形学、图像处理、计算机视觉、计算机辅助设计等多个领域,成为研究数据表示、数据处理、决策分析等一系列问题的综合技术
C.能够把抽象、枯燥或难以理解的内容,包括看似毫无意义的数据、信息、知识等等以一种容易理解的视觉方式展示出来
D.对多维数据进行切片、块、旋转等动作剖析数据,从而多角度多侧面观察数据

75.数据挖掘的主要任务是从数据中发现潜在的规则,从而能更好的完成描述数据、预测数据等任务。

76.数据重组是数据的重新生产和重新采集。

77.高德地图中,可通过数据挖掘,多维分析统计用户出行规律。

78.聚类分析可以看作是一种有监督的分类。

79.用于分类与回归应用的主要算法有)。

A.Apriori算法、HotSpot算法
B.RBF神经网络、K均值法、决策树
C.决策树、BP神经网络、贝叶斯
D.K均值法、SOM神经网络

80.数据开放一般要求要提供全部的原始数据。

81.()是研究两个或两个以上处于同等地位的随机变量相关性的统计分析方法,包括变量之间是否存在依存关系,存在什么样的依存方向等等。

A.主成分分析
B.相关分析
C.回归分析
D.判别分析

82.国务院于()年印发了《促进大数据发展行动纲要》,指出数据已成为国家基础性战略资源。

A.2015
B.2017
C.2016
D.2014

83.将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为()。所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。

A.聚类
B.云计算
C.关联规则
D.机器学习

84.以下哪个选项是目前利用大数据分析技术无法进行有效支持的()。

A.天气情况预测
B.新型病毒的分析判断
C.个人消费习惯分析及预测
D.精确预测股票价格

85.将以下大数据的6V特征对应起来

86.()是一个由Apache基金会所开发的分布式系统基础架构,用户可以在不了解分布式底层细节的情况下,开发分布式程序。它实现了一个分布式文件系统,充分利用集群的威力进行高速运算和存储。

A.Linux
B.Hadoop
C.NoSQL
D.Tomcat

87.国务院于()年印发了《促进大数据发展行动纲要》,指出数据已成为国家基础性战略资源。

A.2016
B.2017
C.2015
D.2014

88.BIRCH是一种()。

A.分类器
B.关联分析算法
C.特征选择算法
D.聚类算法

89.()的目的缩小数据的取值范围,使其更适合于数据挖掘算法的需要,并且能够得到和原始数据相同的分析结果。

A.数据清洗
B.数据变换
C.数据归约
D.数据集成

90.将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为()。所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。

A.关联规则
B.机器学习
C.聚类
D.云计算

91.目前,我国互联网、移动互联网用户规模居全球第(),拥有丰富的数据资源和应用市场优势。

A.二
B.一
C.四
D.三

92.大数据的运用能够加强交通管理。

93.网络公司能够捕捉到用户在其网站上的所有行为,并进行数据分析及挖掘。

94.聚类是指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的过程。

95.大数据的特征不包含()。

A.高速性
B.规模性
C.多样性
D.价值密度高

96.()是考察多个变量间相关性一种多元统计方法,研究如何通过少数几个主成分来揭示多个变量间的内部结构,即从原始变量中导出少数几个主成分,使它们尽可能多地保留原始变量的信息,且彼此间互不相关。

A.预测分析
B.回归分析
C.主成分分析
D.指数分析

97.()是数值数据分布的精确图形表示,是一个连续变量(定量变量)的概率分布的估计。它是一种条形图。

A.散点图
B.折线图
C.圆环图
D.直方图

98.()框架由一个单独的masterJobTracker和每个集群节点一个slaveTaskTracker共同组成。

A.Map/Reduce
B.Reduce
C.Map
D.master

99.分析顾客消费行业,以便有针对性的向其推荐感兴趣的服务,属于()问题。

A.关联规则挖掘
B.分类与回归
C.聚类分析
D.时序预测

100.可视化技术对于分析的数据类型通常不是专用性的。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/天景科技苑/article/detail/838078
推荐阅读
相关标签
  

闽ICP备14008679号