机器学习——聚类算法K-Means

作者：Li_阴宅 | 2024-08-10 11:25:59

踩

机器学习——聚类算法K-Means

一、初识聚类

一、初识聚类

1. 认识聚类算法

聚类算法又叫做 “ 无监督分类 ” ，其目的是 将数据划分成有意义或有用的组（或族）。这种划分可以基于我们的业务需求或建模需求来完成，也可以单纯地帮助我们探索数据的自然结构和分布。

聚类和分类的不同：

2. 聚类的流程

这个过程在可以由下图来显示，我们规定，将数据分为 4 簇（K=4），其中白色 X 代表质心的位置：

在每次迭代中被分配到这个质心上的样本都是一致的，即每次新生成的簇都是一致的，所有的样本点都不会再从一个簇转移到另一个簇，质心就不会变化了。

3. 簇内误差平方和

被分在同一个簇中的数据是有相似性的，而不同簇中的数据是不同的。聚类算法追求 “ 簇内差异小、簇外差异大〞。而这个“差异”，由样本点到其所在簇的质心的距离来衡量。对于一个簇来说，所有样本点到质心的距离之和越小，就认为这个簇中的样本越相似，簇内差异就越小。

距离的衡量方法有多种，令 x 表示簇中的一个样本点，
声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/Li_阴宅/article/detail/958281

推荐阅读

相关标签