当前位置:   article > 正文

k均值聚类算法案例 r语言iris_R语言做K均值聚类的一个简单小例子

r中用iris数据求平均值怎么求

参考链接

k均值聚类是一种比较常用的聚类方法,R语言里做k均值聚类比较常用的函数是kmeans(),需要输入3个参数,第一个是聚类用到的数据,第二个是你想将数据聚成几类k,第三个参数是nstart https://www.datanovia.com/en/lessons/k-means-clustering-in-r-algorith-and-practical-examples/

这篇链接里提到

默认的nstart是1,推荐使用较大的值,以获得一个稳定的结果。比如可以使用25或者50。

那如果想使用k均值聚类的话,就可以分成两种情况,第一种是知道我自己想聚成几类,比如鸢尾花的数据集,明确想聚为3类。这时候直接指定k 下面用鸢尾花数据集做k均值聚类

df

iris.kmeans

names(iris.kmeans)

iris.kmeans结果里存储9个结果,可能会用到的是 iris.kmeans$cluster存储的是每个样本被归为哪一类 iris.kmeans$size存储的是每一个大类有多少个样本

使用散点图展示结果,借助factoextra包中的fviz_cluster()函数

library(factoextra)

fviz_cluster(object=iris.kmeans,data=iris[,1:4],

ellipse.type = "euclid",star.plot=T,repel=T,

geom = ("point"),palette='jco',main="",

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/weixin_40725706/article/detail/529903
推荐阅读
相关标签
  

闽ICP备14008679号