赞
踩
聚类概念:
有个比较好玩的聚类算法可视化网站,可以方便理解聚类算法。
k-means
DBSCAN
(a)一堆没有标签的样本点
(b)随机初始化两个中心点(一红标签一蓝标签)
(c)遍历所有样本点,样本点到哪个中心点的距离最短,就贴上相应的标签。
(d)分别计算红色簇和蓝色簇的质心,作为新的中心点
(e)根据新中心点,重复(c)步骤
(f)重复(d)步骤
一直到质心不再改变,有时候可能会无限迭代下去,这时可以设置最大迭代次数。
由于是随机初始化中心点,所以同样的数据集,相同的K值,运行多次,每次得到的聚类效果可能都不一样。sklearn工具包中的k-means算法是默认跑10次然后取最好的那一次。
注意:这里的评估方法只是一个参考,并不代表最佳的参数选择方案。
kmeans.inertia_
属性来获得Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。