当前位置:   article > 正文

大数据分析中,数据处理之数据归一化_大数据分析归一化

大数据分析归一化

数据处理之数据归一化

为了方便数据处理,通常将数据映射到0~1范围之内,可以使处理过程更加便捷、快速。把有量纲表达式变换为无量纲表达式,成为纯量。该方法实现对原始数据的等比例缩放。通过利用变量取值的最大值和最小值(或者最大值)将原始数据转换为界于某一特定范围的数据,从而消除量纲和数量级影响,改变变量在分析中的权重来解决不同度量的问题。
主要算法有:线性转换、对数函数转换、0 均值标准化(Z-score方法)
下面介绍三大算法的主要公式!!

三大归一化数据处理算法

线性转换

线性比例变换,计算公式如下:
在这里插入图片描述
此处x*表示处理之后的数据,x表示原始数据(下同)

对数函数转换

在这里插入图片描述
上式中,max 表示样本数据中的最大值。

0 均值标准化(Z-score方法)

在这里插入图片描述
上式中,xi表示样本数据,mean(x)表示样本数据平均值,σ表示样本数据的标准差。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/你好赵伟/article/detail/401807
推荐阅读
相关标签
  

闽ICP备14008679号