赞
踩
k-modes是聚类算法的一种,其主要用于处理离散型的数据,是用来解决k-means处理离散型数据问题的一个优化算法。
假设有N个样本,要将其分为三类
import numpy as np
if __name__ == '__main__':
# kmodes思想:
# 1.随机选取k个初始中心点;
# 2.针对数据集中的每个样本点,计算样本点与k个中心点的距离(这边计算的是汉明距离,为两个样本点不同的属性取值的个数),将样本点划分到离它最近的中心点所对应的类别中;
# 3.类别划分完成后,重新确定类别的中心点,将类别中所有样本各特征的众数作为新的中心点对应特征的取值,即该类
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。