赞
踩
简而言之,归一化的目的就是使得预处理的数据被限定在一定的范围内(比如[0,1]或者[-1,1]),从而消除奇异样本数据导致的不良影响。
不同特征往往具有不同的量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据归一化处理,以解决数据指标之间的可比性。例如,原始数据经过数据归一化处理后,各指标处于[0,1]之间的小数,适合进行综合对比评价,提高精度。
标准化是通过特征的平均值和标准差,将特征缩放成一个标准的正态分布,缩放后均值为0,方差为1。
但即使数据不服从正态分布,也可以用此法。特别适用于数据的最大值和最小值未知,或存在孤立点的情况。
1)、标准化是为了方便数据的下一步处理,而进行的数据缩放等变换,不同于归一化,并不是为了方便与其他数据一同处理或比较。
2)、标准化后的变量值围绕0上下波动,大于0说明高于平均水平,小于0说明低于平均水平。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。