赞
踩
persion是将x,y坐标各自平移到原点后的余弦夹角
kmeans++ 初始化的seed点应该尽可能远
算法
从上面的算法描述上可以看到,算法的关键是第3步,如何将D(x)反映到点被选择的概率上,一种算法如下
算法: 将簇定义为密度相连的点的最大集合
定义:
算法:
局部密度 ρi=∑jχ(dij−dc)ρi=∑jχ(dij−dc); χ={1x<00otherwiseχ={0otherwise1x<0 dc是阶段距离,ρi是到对象i的距离小于dc的对象的个数dc是阶段距离,ρi是到对象i的距离小于dc的对象的个数 dc选择,使得平均每个点的领居数为所有点的1%−2%dc选择,使得平均每个点的领居数为所有点的1%−2%
高局部密度 δi=minj:ρi>ρj(dij)δi=minj:ρi>ρj(dij) 局部密度高于对象i的所有对象中,到对象i最近的距离局部密度高于对象i的所有对象中,到对象i最近的距离