赞
踩
DBSCAN聚类算法三部分:
1、 DBSCAN原理、流程、参数设置、优缺点以及算法;
http://blog.csdn.net/zhouxianen1987/article/details/68945844
2、 matlab代码实现;
blog:http://blog.csdn.net/zhouxianen1987/article/details/68946169
code:http://download.csdn.net/detail/zhouxianen1987/9789230
3、 C++代码实现及与matlab实例结果比较。
blog:http://blog.csdn.net/zhouxianen1987/article/details/68946278
code:http://download.csdn.net/detail/zhouxianen1987/9789231
DBSCAN(Density-based spatial clustering ofapplications with noise)是Martin Ester, Hans-PeterKriegel等人于1996年提出的一种基于密度的空间的数据聚类方法,该算法是最常用的一种聚类方法[1,2]。该算法将具有足够密度区域作为距离中心,不断生长该区域,算法基于一个事实:一个聚类可以由其中的任何核心对象唯一确定[4]。该算法利用基于密度的聚类的概念,即要求聚类空间中的一定区域内所包含对象(点或其他空间对象)的数目不小于某一给定阈值。该方法能在具有噪声的空间数据库中发现任意形状的簇,可将密度足够大的相邻区域连接,能有效处理异常数据,主要用于对空间数据的聚类,优缺点总结如下[3,4]:
优点:
(1)聚类速度快且能够有效处理噪声点和发现任意形状的空间聚类;
(2)与K-MEANS比较起来,不需要输入要划分的聚类个数;
(3)聚类簇的形状没有偏倚;
(4)可以在需要时输入过滤噪声的参数。
缺点:
(1)当数据量增大时,要求较大的内存支持I/O消耗也很大;
(2)当空间聚类的密度不均匀、聚类间距差相差很大时,聚类质量较差,因为这种情况下参数MinPts和Eps选取困难。
(3)算法聚类效果依赖与距离公式选取,实际应用中常用欧式距离,对于高维数据,存在“维数灾难”。
基本概念[5]:如下基本概念在[6]中有更为详细说明介绍。
(1)Eps邻域:给定对象半径Eps内的邻域称为该对象的Eps邻域;
(2)核心点(core point):如果对象的
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。