当前位置:   article > 正文

pandas数据预处理之标准化数据_使用标准差标准化处理s列的数据pandas

使用标准差标准化处理s列的数据pandas
"""=====================================标准化数据========================================"""
# 一般特征之间有不同的量纲,如果不做处理,会造成数据间的差异很大,则涉及空间距离计算或者相似度计算时,需要对不同特征数据标准化

# (1.)离差标准化:x=(x-min)/(max-min)  注意:1、当max= min 没有意义 2、min/max是否为异常值
x_max = detail['amounts'].max()
x_min = detail['amounts'].min()
x = (detail['amounts'] - x_min) / (x_max - x_min)
# print(x)

# (2.)标准差标准化:x=(x-mean)/std
x_mean = detail['amounts'].mean()
x_std = detail['amounts'].std()
x1 = (detail['amounts'] - x_mean) / x_std
# print(x1)

# (3.)小数定标标准化数据 x=x/10`k  将所有的数都化为小数
# 1、找到最大值 x.max()=10`k  k=log10(|x|.max()):k可能是小数,向上取整
k_max = abs(detail['counts']).max()
k = np.ceil(np.log10(k_max))
m = detail['counts'] / 10 ** k
# print(m)
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/花生_TL007/article/detail/208603
推荐阅读
相关标签
  

闽ICP备14008679号