赞
踩
KMeans算法本身思想比较简单,但是合理的确定K值和K个初始类簇中心点对于聚类效果的好坏有很大的影响。
总结了一下,大概有以下几种方法。
1.随机选择,选择批次距离尽可能远的K个点
(1)随机选一个点作为一个类簇的初始中心点
(2)然后选取距离这个点最远的点作为第二个点
(3)之后选与前两个点距离和最远的点作为第三个点,一次类推。(有的说法是选择与前两个点最近距离最大的点作为第三个点)
(4)递归依次选择接下来的点
2.选用层次聚类或者Canopy算法进行初始聚类,然后利用这些类簇的中心点作为KMeans算法初始类簇中心点。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。