当前位置:   article > 正文

机器学习算法-DBSCAN聚类_dbscan 聚类多维度样本集合

dbscan 聚类多维度样本集合

DBSCAN(Density-Based Spatial Clustering of Applications with Noise)是一个比较有代表性的基于密度的聚类算法。与划分和层次聚类方法不同,它将簇定义为密度相连的点的最大集合,能够把具有足够高密度的区域划分为簇,并可在有“噪声”的空间数据库中发现任意形状的聚类。

一、基础概念

在介绍算法之前,先明确几个在DBSCAN模型中常用的概念:

  1. 对象的ϵ-临域:给定对象在半径ϵ内的区域。
  2. 对象:如果一个对象的ϵ-临域至少包含最小数目MinPts个对象,则称该对象为核心对象。
    例如,在下图中,ϵ=1cmMinPts=5q是一个核心对象,而p不是,o也不是。
    这里写图片描述
  3. 直接密度可达:给定一个对象集合D,如果p是在q的ε-邻域内,而q是一个核心对象,我们说对象p从对象q出发是直接密度可达的。
    例如,在下图中,ϵ=1cmMinPts=5q是一个核心对象,对象p从对象q出发是直接密度可达的,而对象o从对象
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/知新_RL/article/detail/293242
推荐阅读
相关标签
  

闽ICP备14008679号