赞
踩
https://blog.csdn.net/Dhane/article/details/86661208
算法思想
k-means算法的思想比较简单,假设我们要把数据分成K个类,大概可以分为以下几个步骤:
随机选取k个点,作为聚类中心;
计算每个点分别到k个聚类中心的聚类,然后将该点分到最近的聚类中心,这样就行成了k个簇;
再重新计算每个簇的质心(均值);
重复以上2~4步,直到质心的位置不再发生变化或者达到设定的迭代次数。
K-means算法优点:
1)、是解决聚类问题的一种经典算法,简单、快速
K-means算法缺点:
(2)、在 K-means 算法中 K 是事先给定的,这个 K 值的选定是非常难以估计的。很多时候,事先并不知道给定的数据集应该分成多少个类别才最合适;
(3)一旦初始值选择的不好,可能无法得到有效的聚类结果,有可能陷入局部最优
(4)、该算法需要不断地进行样本分类调整,不断地计算调整后的新的聚类中心,因此当数据量非常大时,算法的时间开销是非常大的;
(5)对噪声和孤立点数据敏感
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。