当前位置:   article > 正文

sklearn.preprocessing.normalize()

preprocessing.normalize

sklearn.preprocessing.normalize()是Scikit-learn库中的一个函数,用于对特征向量进行归一化处理。归一化的目的是将每个样本的特征向量缩放到单位范数(即长度为1)。

normalize函数的主要参数包括:

  • X:要归一化的数组或稀疏矩阵,形状为[n_samples, n_features]
  • norm:指定要使用的范数类型,可以是l1、l2或max
    • l1范数:将每个样本的特征向量的绝对值之和归一化为1
    • l2范数:将每个样本的特征向量的欧几里得长度归一化为1(默认)
    • max范数:将每个样本的特征向量的最大绝对值归一化为1

以下是一个简单的代码示例,

  1. import numpy as np
  2. from sklearn.preprocessing import normalize
  3. # 示例数据
  4. X = np.array([[1, 2, 3],
  5. [4, 5, 6],
  6. [7, 8, 9]])
  7. # 使用 l2 范数进行归一化
  8. X_normalized_l2 = normalize(X, norm='l2')
  9. # 使用 l1 范数进行归一化
  10. X_normalized_l1 = normalize(X, norm='l1')
  11. # 使用 max 范数进行归一化
  12. X_normalized_max = normalize(X, norm='max')
  13. print("Original Data:\n", X)
  14. print("\nL2 Normalized Data:\n", X_normalized_l2)
  15. print("\nL1 Normalized Data:\n", X_normalized_l1)
  16. print("\nMax Normalized Data:\n", X_normalized_max)

输出结果如下,

  1. Original Data:
  2. [[1 2 3]
  3. [4 5 6]
  4. [7 8 9]]
  5. L2 Normalized Data:
  6. [[0.26726124 0.53452248 0.80178373]
  7. [0.45584231 0.56980288 0.68376346]
  8. [0.50257071 0.57436653 0.64616234]]
  9. L1 Normalized Data:
  10. [[0.16666667 0.33333333 0.5 ]
  11. [0.26666667 0.33333333 0.4 ]
  12. [0.29166667 0.33333333 0.375 ]]
  13. Max Normalized Data:
  14. [[0.33333333 0.66666667 1. ]
  15. [0.66666667 0.83333333 1. ]
  16. [0.77777778 0.88888889 1. ]]

以下是安装指令,

  1. pip install scikit-learn
  2. conda install scikit-learn
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/空白诗007/article/detail/912318
推荐阅读
相关标签
  

闽ICP备14008679号