赞
踩
数据处理之数据归一化
为了方便数据处理,通常将数据映射到0~1范围之内,可以使处理过程更加便捷、快速。把有量纲表达式变换为无量纲表达式,成为纯量。该方法实现对原始数据的等比例缩放。通过利用变量取值的最大值和最小值(或者最大值)将原始数据转换为界于某一特定范围的数据,从而消除量纲和数量级影响,改变变量在分析中的权重来解决不同度量的问题。
主要算法有:线性转换、对数函数转换、0 均值标准化(Z-score方法)
下面介绍三大算法的主要公式!!
线性比例变换,计算公式如下:
此处x*表示处理之后的数据,x表示原始数据(下同)
上式中,max 表示样本数据中的最大值。
上式中,xi表示样本数据,mean(x)表示样本数据平均值,σ表示样本数据的标准差。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。