赞
踩
K-prototype是处理混合属性聚类的典型算法。继承Kmean算法和Kmode算法的思想。并且加入了描述数据簇的原型和混合属性数据之间的相异度计算公式。虽然k-prototype算法对于混合属性的聚类效果很好,但是在样本较大的时候,效率低下。基于效率低下这个问题。我尝试用one-hot编码处理分类属性,对数值型变量进行标准化,然后用K-means聚类算法,可达到与k_prototype相同的聚类结果。
参考博客:https://blog.csdn.net/u014028070/article/details/52138672
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。