当前位置:   article > 正文

聚类方法:DBSCAN算法研究(1)--DBSCAN原理、流程、参数设置、优缺点以及算法_dbscan聚类算法

dbscan聚类算法

DBSCAN聚类算法三部分:

1、        DBSCAN原理、流程、参数设置、优缺点以及算法;

http://blog.csdn.net/zhouxianen1987/article/details/68945844

2、        matlab代码实现; 

blog:http://blog.csdn.net/zhouxianen1987/article/details/68946169

codehttp://download.csdn.net/detail/zhouxianen1987/9789230

3、        C++代码实现及与matlab实例结果比较。

blog:http://blog.csdn.net/zhouxianen1987/article/details/68946278

       codehttp://download.csdn.net/detail/zhouxianen1987/9789231


DBSCAN(Density-based spatial clustering ofapplications with noise)Martin Ester, Hans-PeterKriegel等人于1996年提出的一种基于密度的空间的数据聚类方法,该算法是最常用的一种聚类方法[1,2]。该算法将具有足够密度区域作为距离中心,不断生长该区域,算法基于一个事实:一个聚类可以由其中的任何核心对象唯一确定[4]。该算法利用基于密度的聚类的概念,即要求聚类空间中的一定区域内所包含对象(点或其他空间对象)的数目不小于某一给定阈值。该方法能在具有噪声的空间数据库中发现任意形状的簇,可将密度足够大的相邻区域连接,能有效处理异常数据,主要用于对空间数据的聚类,优缺点总结如下[3,4]:

优点

1)聚类速度快且能够有效处理噪声点和发现任意形状的空间聚类;

2)与K-MEANS比较起来,不需要输入要划分的聚类个数;

3)聚类簇的形状没有偏倚;

4)可以在需要时输入过滤噪声的参数。

缺点:

1)当数据量增大时,要求较大的内存支持I/O消耗也很大;

2)当空间聚类的密度不均匀、聚类间距差相差很大时,聚类质量较差,因为这种情况下参数MinPtsEps选取困难。

3)算法聚类效果依赖与距离公式选取,实际应用中常用欧式距离,对于高维数据,存在维数灾难

基本概念[5]如下基本概念在[6]中有更为详细说明介绍。

1Eps邻域:给定对象半径Eps内的邻域称为该对象的Eps邻域;

2)核心点(core point):如果对象的

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家自动化/article/detail/519951
推荐阅读
  

闽ICP备14008679号