赞
踩
我们在处理数据的时候,经常会遇到量纲不一样的情况。例如1元和1角,数值都为1,但是谁大呢?这种情况对我们人而言,已经是常识了,但是对机器呢?还有我们不熟悉的情况呢?这就需要归一化(normalization),我们需要将它们映射到统一的一个区间,使得在这个区间内直接对它们操作是合理的。在知乎上我一个同学是这样回答的“归一化首先在维数非常多的时候,可以防止某一维或某几维对数据影响过大,其次可以程序可以运行更快。方法很多,min-max,z-score,p范数等,具体怎么使用,要根据数据集的特征来选择。”(http://www.zhihu.com/question/20455227)
归一化具体的是指,将数据按比例缩放,使之落入一个小的特定区间。
常用的归一化方法有:
1. min-max归一化
这是一种线性规范化,具体计算公式为:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。