赞
踩
参考链接:
https://blog.csdn.net/qq_54804745/article/details/123808288?spm=1001.2014.3001.5502
限于博主的水平,文章难免存在不妥之处,恳请广大读者批评指正!
聚类分析是基于对样本数据进行适当划分的思想,实现对样本数据的聚类分析,该方法首先需要确定划分快的个数即聚簇的个数,然后通过适当方式将样本数据聚集成指定个数的聚簇。k-均值聚类算法又称k-Means聚类算法,其中k表示聚类所得到聚簇的个数。顾名思义,k-均值聚类算法是一种通过均值指标对数据进行聚类的方法。
提示:文末提供代码供参考
k-均值聚类算法从初始划分所对应类内距离开始,通过逐步调整划分的方式最小化类内距离
d
(
C
1
,
C
2
,
⋅
⋅
⋅
,
C
k
)
d (C{_1},C{_2},···,C{_k})
d(C1,C2,⋅⋅⋅,Ck),由此得到类内距离最小聚类结果。
C
1
,
C
2
,
⋅
⋅
⋅
,
C
k
C{_1},C{_2},···,C{_k}
C1,C2,⋅⋅⋅,Ck表示将所有样本数据分为k类簇,假定样本数据集如下:
D
=
{
X
1
,
X
2
,
⋅
⋅
⋅
,
X
k
}
D = \left \{ X{_1},X{_2},···,X{_k} \right \}
D={X1,X2,⋅⋅⋅,Xk}
算法具体过程如下:
- 令s=0,并从D中随机生成k个作为初始聚类中心的数据点
u 1 0 , u 2 0 , u 3 0 , ⋅ ⋅ ⋅ , u k 0 u{_1}^0,u{_2}^0,u{_3}^0,···,u{_k}^0 u10,u20,u30,⋅⋅⋅,uk0;声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/不正经/article/detail/129068
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。