赞
踩
如今的聚类技术,应用较广的是划分聚类和分层聚类。
划分聚类:
初始构造n个簇,然后不断更改每个簇内的成员,最终直到每个簇的成员稳定为止。
分层聚类:
根据分层策略的不同,又分为凝聚聚类和分裂聚类。凝聚聚类,将所有的向量都视为单独的簇,然后根据他们的相似度进行合并。分裂聚类,将所有的向量视为一个簇,然后不断对他们进行分裂,例如二分kmeans。
Kmeans就是基于划分聚类的算法。
首先讲清楚,kmeans只能找出球形的类,而不能找出任意形状的类。
朴素kmeans的算法原理:
注意:
衡量算法优劣的评估标准:sse(误差平方和)
算法的改进:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。