赞
踩
第三十五次写博客,本人数学基础不是太好,如果有幸能得到读者指正,感激不尽,希望能借此机会向大家学习。本文作为基于图的聚类的第三部分,主要针对“SNN密度(Shared Nearest Neighbour Density)”以及一种使用该密度的“类DBSCAN聚类”算法进行介绍。其他基于图的聚类算法的链接可以在这篇综述《基于图的聚类算法综述(基于图的聚类算法开篇)》的结尾找到。
在高维样本空间中,传统的欧几里得密度度量没有意义,以至于基于网格的聚类、基于密度的聚类,还是基于核密度估计的密度聚类都无法在这种情况下进行应用,虽然借助于类似Jaccard或余弦相似度等度量方法可以在高维空间下获得良好的效果,不过仍有一些问题。SNN密度关注于数据集中样本点的局部结构,因此对簇之间密度的变化和空间的维度都不敏感,因此这种度量方法适合应用于高维样本空间中,他与DBSCAN中密度的定义类似,不过与DBSCAN中使用传统欧氏距离不同的是,它采用上一篇文章中介绍的“SNN相似度”,因此下面依照DBSCAN中所介绍的密度,对SNN密度进行重新定义。
1) 核心点:如果在某点给定邻域范围(由 E p
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。