k均值聚类算法案例 r语言iris_R语言做K均值聚类的一个简单小例子

作者：weixin_40725706 | 2024-05-03 13:40:25

踩

r中用iris数据求平均值怎么求

参考链接

k均值聚类是一种比较常用的聚类方法，R语言里做k均值聚类比较常用的函数是kmeans()，需要输入3个参数，第一个是聚类用到的数据，第二个是你想将数据聚成几类k，第三个参数是nstart https://www.datanovia.com/en/lessons/k-means-clustering-in-r-algorith-and-practical-examples/

这篇链接里提到

默认的nstart是1，推荐使用较大的值，以获得一个稳定的结果。比如可以使用25或者50。

那如果想使用k均值聚类的话，就可以分成两种情况，第一种是知道我自己想聚成几类，比如鸢尾花的数据集，明确想聚为3类。这时候直接指定k 下面用鸢尾花数据集做k均值聚类

iris.kmeans

names(iris.kmeans)

iris.kmeans结果里存储9个结果，可能会用到的是 iris.kmeans$cluster存储的是每个样本被归为哪一类 iris.kmeans$size存储的是每一个大类有多少个样本

使用散点图展示结果，借助factoextra包中的fviz_cluster()函数

library(factoextra)

fviz_cluster(object=iris.kmeans,data=iris[,1:4],

ellipse.type = "euclid",star.plot=T,repel=T,

geom = ("point"),palette='jco',main="",

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/weixin_40725706/article/detail/529903