赞
踩
"""=====================================标准化数据========================================""" # 一般特征之间有不同的量纲,如果不做处理,会造成数据间的差异很大,则涉及空间距离计算或者相似度计算时,需要对不同特征数据标准化 # (1.)离差标准化:x=(x-min)/(max-min) 注意:1、当max= min 没有意义 2、min/max是否为异常值 x_max = detail['amounts'].max() x_min = detail['amounts'].min() x = (detail['amounts'] - x_min) / (x_max - x_min) # print(x) # (2.)标准差标准化:x=(x-mean)/std x_mean = detail['amounts'].mean() x_std = detail['amounts'].std() x1 = (detail['amounts'] - x_mean) / x_std # print(x1) # (3.)小数定标标准化数据 x=x/10`k 将所有的数都化为小数 # 1、找到最大值 x.max()=10`k k=log10(|x|.max()):k可能是小数,向上取整 k_max = abs(detail['counts']).max() k = np.ceil(np.log10(k_max)) m = detail['counts'] / 10 ** k # print(m)
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。