赞
踩
数据分析技术使数据分析人员能够审查并回顾收集的数据,并根据信息进行推断或确定。大多数技术都侧重于应用定量技术来审查数据,一些比较常见的定量数据分析技术包括描述性统计、探索性数据分析和验证性数据分析。后两者涉及使用支持或不支持预定假设。使用这些技术的团体包括个人数据分析人员、学生、企业、政府机构和精算师,以及需要信息和数据的其他各个方面。
定量数据分析:
有时在尝试从收集的数据中消除数据分析人员的偏见。大量使用统计、概率或其他数学技术允许个人使用标准方法来解释数据。当数据分析人员试图使用定性数据分析技术时,一般基于个人的个人背景、偏好或基本研究和推理原则,收集的数据可能会被误读或错误解释。因此,数学技术不太容易受到这些错误的影响,而且往往更容易为其他个人或数据分析人员所接受。
描述性统计分析:
将数据分离或汇总成特定的组。如,人口统计学就是一组常见的描述性统计,数据分析人员将收集与人口年龄、性别、家庭规模、收入、工作类型和其他信息等相关的信息。另一种描述性统计分析,如,足球比赛中进行四分卫的完成百分比,如果四分卫在8次传球尝试中完成6次,他就有75%的成功率。这种技术的一个缺陷是统计数据无法提供额外的信息,比如每次传递的长度。
探索性数据分析技术:
通常使用箱形图、直方图、帕累托图、散点图或茎叶图,这项技术的主要目的是支持数据分析人员提出的假设。例如,数据分析人员可能想要证明一个关于驾驶特定类型汽车(如小型货车)的车主年龄范围的假设。为了验证和支持这一假设,数据分析人员将收集信息,并创建一个方框图,以确定在他规定的范围内的所有者数量。统计数据将提供支持或不支持假设的信息,并显示收集的数据中有多少异常值。
验证性数据分析技术:
是站在探索性技术的对立面。在这些测试中,数据分析人员可能希望推翻零假设,这是一个被大多数人普遍接受为正确的陈述。为了反驳原假设,研究者会收集与原假设相关的具体信息,并检验平均值、方差、p值和置信区间。由验证性数据分析所证明的置信区间将提供信息,说明数据分析人员对原假设是真还是假应该有多大的信心。
大数据分析模型只是前人总结出的方式方法,对于我们实际工作中解决问题有引导作用,但是不可否认,具体问题还要具体分析,针对不同的情况需要进行不同的改进,希望成为一个数据专家,最重要的一点还是多实践!实践才是真理。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。