赞
踩
预测是数据分析的终极目的预测的必要性和误差的必然性经验预测法
类比预测法惯性法与时间序列分析逻辑关系预测法
1.1 预测是数据分析的终极目的
数据分析最重要的目的就是从数据中寻找规律,找到能够指导我们未来实践的原则和方法,它是产生智慧的主要途径。所以,预测分析是数据分析的终极目的。虽然数据分析可以承担各种功能,包括监测、监控、检查、证据、校验,但预测还是最为关键的,所以掌握数据分析和挖掘的预测方法才是数据分析师的看家本领。
预测包括现象的预测和规律的预测。自然科学在本质上也是对事物的属性、本质和规律的预测。有了对事物的认知和对规律的掌握,我们就能够创造出更多的东西。商业社会也是如此,如果我们能够知道影响股票波动的因素,并能够掌握这些影响因素的数据,就能够对股价做出精准的预测,从而指导我们的投资决策,做到稳赚不赔。但事物具有复杂性,我们无法掌握所有的信息,更无法掌握所有的规律,所以才会有了那么多的偶然影响因素和随机事件。
在美国电视剧(简称美剧)《疑犯追踪》中有一台超级服务器,它能够掌握所有事情,预测所有事情的发展,从而能够预测各种犯罪的发生和危险事件。主人公与几个特工组成一个阻止悲剧发生的战队,开始了各种所谓的营救行动。这样的机器或许在未来能够出现,但在目前能掌握所有事物的数据并通晓其规律的机器还没有。在智能领域,我们已经能够制造出会下围棋的AlphaGo,但距离精准的预测还有很大的距离,但这并不能阻止我们对某些特殊事物的预测。
随着大数据、物联网等技术的快速发展和应用,我们会拥有越来越多的数据,在这些数据的基础上,通过各种分析技术的发展,我们就能够加工出越来越多的“智慧”,从而能够指导我们的实践,而我们对未来的预测会越来越精准,越来越有效。
人们总是把事情想象得过于美好,认为做大数据的人能够上知天文,下晓地理,能够准确地预测未来。现在还没有人有这样的能力,至少目前不会有,未来10年估计也不会有。所以企业的老板也不能对数据部门寄予过高的期望。
经济学、社会学、社会物理学、心理学、统计学和数学等众多学科都是预测的工具和方法,人类已经掌握了一些基本的事物发展规律,对人类大脑、情感、心理的认知也逐步深入。但我们对这些学科的掌握程度还远远达不到准确预测未来的程度,我们所知道的仅仅是大自然中非常小的一部分。所以永远不要过高地估计我们对世界的认知。
20年前,互联网刚刚开始兴起,那个时候人们觉得互联网永远无法取代电视、报纸、杂志和广播,认为互联网只会成为信息传播的一种工具,而且最初人们只希望用互联网来传播知识,而拒绝使用互联网从事商业行为。20年后的今天,互联网的普及彻底改变了我们的生活方式。
我们经常说“以史为鉴”,其实就是研究事物发展的历史,为我们研究新的事物做出指导,让我们对未来的事物有更远一点的估计。研究互联网的发展历史,能够让我们更好地估计或者预测同为信息技术的大数据技术在未来的发展。
互联网从1995年开始推广应用到2015年,整整20年的时间,其已经不再被看作是新的技术了,而是日常必不可少的一种技术应用,而且应用的范围和领域也越来越广,如下图所示。如今我们已经真正进入到“互联网+”的时代。
纳斯达克历史综合指数也揭示了一个技术成长的过程,如下图所示。因为纳斯达克主要以互联网新技术公司为主要的投资对象,该股票交易市场的主体是互联网公司,其综合指数直接体现出这些公司的市场价值。
著名的研究公司Gartner以研究技术发展和为技术公司提供咨询服务为主。其跟踪和研究各种新技术的发展历程,并形成了一个关于技术发展周期的HypeCycle理论体系。此理论体系将技术的发展分成触发期、过热期、幻灭期、复苏期和创新应用期。不同的技术发展会有不同的结局,有的会在发展的过程中就消逝了,有的成了影响人们生活的重要技术。在Gartner看来,不同的技术处在不同的阶段,大家对其的期望会有不同,这在股票市值或者公司估值上能够体现出来。
下图是Gartner对新兴技术的研究结论:不同的技术处在不同的时期。大数据技术在2014年曾经被Gartner认为进入幻灭期,目前其在中国仍然处在过热期,大家都看好这个技术,动辄就投资几十亿元来推动大数据应用,而得到的实际应用价值还是非常少的,但是这个技术却比互联网更加
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。