当前位置:   article > 正文

k-means初始中心的选择

初始中心

http://blog.csdn.net/hustlx/article/details/51362267

原文介绍了几种初始中心的方法,以及k值的选择。

初始中心选择过程中,对于第一种方法,即:

1.假设原始数据集为x,先随机选择一个数据点center_first(或者指定)

2.定义一个距离标准dist,计算dist(center_first,x)

3.选择出距离最远的那个数据点。

4.然后在迭代,寻找下一个距离之前的初始中心距离最远的点,直到指定的k值都选择完毕。


在运用这个方法的过程中,需要注意的是:

1.数据集若有离群点,那么选择的中心可能会有问题。

这一点可以通过取均值的情况得以缓解。

总体效果还可以接受

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/运维做开发/article/detail/812940
推荐阅读
相关标签
  

闽ICP备14008679号