赞
踩
k-means算法是一种简单且实用的聚类算法,但是传统的k-means算法只适用于连续属性的数据集,而对于离散属性的数据集,计算簇的均值以及点之间的欧式距离就变得不合适了。k-modes作为k-means的一种扩展,适用于离散属性的数据集。
假设有N个样本,M个属性且全是离散的,簇的个数为k
步骤一:随机确定k个聚类中心
步骤二:对于样本
步骤三:将
步骤四:重复步骤二和三,直到总距离(各个簇中样本与各自簇中心距离之和)不再降低,返回最后的聚类结果。
假设有7个样本,每个样本有4个属性,表示为矩阵X
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。