当前位置:   article > 正文

k-means确定初始中心值的方法_k均值算法的簇中心如何初始化?

k均值算法的簇中心如何初始化?
KMeans算法是最常用的聚类算法,主要思想是:在给定K值和K个初始类簇中心点的情况下,把每个点(亦即数据记录)分到离其最近的类簇中心点所代表的类簇中,所有点分配完毕之后,根据一个类簇内的所有点重新计算该类簇的中心点(取平均值),然后再迭代的进行分配点和更新类簇中心点的步骤,直至类簇中心点的变化很小,或者达到指定的迭代次数。

KMeans算法本身思想比较简单,但是合理的确定K值和K个初始类簇中心点对于聚类效果的好坏有很大的影响。

总结了一下,大概有以下几种方法。

1.随机选择,选择批次距离尽可能远的K个点

(1)随机选一个点作为一个类簇的初始中心点

(2)然后选取距离这个点最远的点作为第二个点

(3)之后选与前两个点距离和最远的点作为第三个点,一次类推。(有的说法是选择与前两个点最近距离最大的点作为第三个点)

(4)递归依次选择接下来的点

2.选用层次聚类或者Canopy算法进行初始聚类,然后利用这些类簇的中心点作为KMeans算法初始类簇中心点。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/IT小白/article/detail/812949
推荐阅读
相关标签
  

闽ICP备14008679号