赞
踩
参考链接
k均值聚类是一种比较常用的聚类方法,R语言里做k均值聚类比较常用的函数是kmeans(),需要输入3个参数,第一个是聚类用到的数据,第二个是你想将数据聚成几类k,第三个参数是nstart https://www.datanovia.com/en/lessons/k-means-clustering-in-r-algorith-and-practical-examples/
这篇链接里提到
默认的nstart是1,推荐使用较大的值,以获得一个稳定的结果。比如可以使用25或者50。
那如果想使用k均值聚类的话,就可以分成两种情况,第一种是知道我自己想聚成几类,比如鸢尾花的数据集,明确想聚为3类。这时候直接指定k 下面用鸢尾花数据集做k均值聚类
df
iris.kmeans
names(iris.kmeans)
iris.kmeans结果里存储9个结果,可能会用到的是 iris.kmeans$cluster存储的是每个样本被归为哪一类 iris.kmeans$size存储的是每一个大类有多少个样本
使用散点图展示结果,借助factoextra包中的fviz_cluster()函数
library(factoextra)
fviz_cluster(object=iris.kmeans,data=iris[,1:4],
ellipse.type = "euclid",star.plot=T,repel=T,
geom = ("point"),palette='jco',main="",
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。