赞
踩
DBSCAN是一种基于密度的聚类算法,它的原理是假定类别可以通过样本分布的紧密程度决定。同一类别的样本之间是紧密相连的,也就是说,在该类别任意样本周围不远处一定有同类别的样本存在。通过将紧密相连的样本划为一类,这样就得到了一个聚类类别。通过将所有各组紧密相连的样本划为各个不同的类别,则我们就得到了最终的所有聚类类别结果。
在这个网站你也可以试试DBSCAN可视化网址
数据处理前:
这里epsilon指的为半径,minPoints指的是在半径为1的空间里有四个小球即可扩散
扩散后图像:
数据处理前:
数据处理后:
这个算法的一个主要优点是它可以找到任意形状的簇,而不仅仅是凸形的簇。同时,它也可以发现噪声点,并将其形成一个独立的簇。
如果数据集的密度分布不均匀,那么选择合适的ε和MinPts参数可能会很困难。此外,如果数据集中存在大量噪声点,那么DBSCAN可能会将噪声点误分类为边界点或核心点。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。