当前位置:   article > 正文

无监督学习k-means算法思想及代码实现附数据集_kmeans 数据集

kmeans 数据集

机器学习系列文章目录



参考链接:
https://blog.csdn.net/qq_54804745/article/details/123808288?spm=1001.2014.3001.5502

前言

限于博主的水平,文章难免存在不妥之处,恳请广大读者批评指正!

聚类分析是基于对样本数据进行适当划分的思想,实现对样本数据的聚类分析,该方法首先需要确定划分快的个数即聚簇的个数,然后通过适当方式将样本数据聚集成指定个数的聚簇。k-均值聚类算法又称k-Means聚类算法,其中k表示聚类所得到聚簇的个数。顾名思义,k-均值聚类算法是一种通过均值指标对数据进行聚类的方法。


提示:文末提供代码供参考

一、算法步骤

k-means介绍

k-均值聚类算法从初始划分所对应类内距离开始,通过逐步调整划分的方式最小化类内距离 d ( C 1 , C 2 , ⋅ ⋅ ⋅ , C k ) d (C{_1},C{_2},···,C{_k}) d(C1,C2,,Ck),由此得到类内距离最小聚类结果。 C 1 , C 2 , ⋅ ⋅ ⋅ , C k C{_1},C{_2},···,C{_k} C1,C2,,Ck表示将所有样本数据分为k类簇,假定样本数据集如下:
D = { X 1 , X 2 , ⋅ ⋅ ⋅ , X k } D = \left \{ X{_1},X{_2},···,X{_k} \right \} D={X1,X2,,Xk}
算法具体过程如下:

  1. 令s=0,并从D中随机生成k个作为初始聚类中心的数据点
    u 1 0 , u 2 0 , u 3 0 , ⋅ ⋅ ⋅ , u k 0 u{_1}^0,u{_2}^0,u{_3}^0,···,u{_k}^0 u10,u20,u30,,uk0;
    声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/不正经/article/detail/129068
推荐阅读
相关标签