K-modes算法主要用于分类数据,如 国籍,性别等特征。
距离使用汉明距离,即有多少对应特征不同则距离为几。
中心点计算为,选择众数作为中心点。
主要功能:
随机初始化聚类中心,计算聚类。
选择每次聚类次数,选择最佳聚类初始化。
kmodes.m代码
function [cx,cost] = kmodes(K,data,num) % 生成将data聚成K类的最佳聚类 % K为聚类数目,data为数据集,num为随机初始化次数 [cx,cost] = kmodes1(K,data); for i = 2:num [cx1,min] = kmodes1(K,data); if min<cost cost = min; cx =