当前位置:   article > 正文

python实现K均值聚类_k均值聚类 python

k均值聚类 python

K均值(K-Means)聚类是一种非常常见的无监督学习算法,用于将数据点划分为K个集群。以下是使用Python和scikit-learn库实现K均值聚类分析的基本步骤:

  1. 导入必要的库
  2. 准备数据集
  3. 初始化K均值聚类器
  4. 训练聚类器
  5. 预测数据点的集群
  6. 可视化结果(如果数据集是二维的)

下面是一个简单的示例:

  1. from sklearn.cluster import KMeans
  2. import numpy as np
  3. import matplotlib.pyplot as plt
  4. # 1. 准备数据集
  5. # 假设我们有一个二维数据集
  6. data = np.array([[1, 2], [1, 4], [1, 0], [10, 2], [10, 4], [10, 0]])
  7. # 2. 初始化K均值聚类器
  8. # 我们选择K=2,即我们想要将数据划分为两个集群
  9. kmeans = KMeans(n_clusters=2, random_state=0)
  10. # 3. 训练聚类器
  11. kmeans.fit(data)
  12. # 4. 预测数据点的集群
  13. labels = kmeans.predict(data)
  14. # 5. 可视化结果
  15. plt.scatter(data[:, 0], data[:, 1], c=labels, s=50, cmap='viridis')
  16. # 画出聚类中心
  17. centers = kmeans.cluster_centers_
  18. plt.scatter(centers[:, 0], centers[:, 1], c='black', s=200, alpha=0.5);
  19. plt.show()

在上面的代码中,我们首先导入了必要的库,然后准备了一个简单的二维数据集。我们初始化了一个K均值聚类器,设置了集群数量为2,并使用数据集对其进行训练。然后,我们使用聚类器预测数据点的集群,并使用matplotlib库将结果可视化。最后,我们还画出了每个集群的中心点。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小舞很执着/article/detail/774639
推荐阅读
相关标签
  

闽ICP备14008679号