首页 理论教育基本概念:DBSCAN密度聚类算法

基本概念:DBSCAN密度聚类算法

【摘要】:图9-2DBSCAN基本概念(见彩插)图9-3“直接密度可达”和“密度可达”概念示意描述根据前面基本概念的描述知道:由于有标记的各点M、P、O和R的Eps近邻均包含三个以上的点,因此它们都是核对象;M是从P“直接密度可达”;而Q则是从M“直接密度可达”;基于上述结果,Q是从P“密度可达”;但P从Q无法“密度可达”(非对称)。

(1)Eps邻域:给定对象半径Eps内的邻域称为该对象的Eps邻域。

(2)核心点:如果对象的Eps邻域至少包含最小数目minPts的对象,则称该对象为核心对象。

(3)边界点:边界点不是核心点,但落在某个核心点的邻域内。

(4)噪声点:既不是核心点,也不是边界点的任何点。

(5)直接密度可达:给定一个对象集合D,如果p在q的Eps邻域内,而q是一个核心对象,则称对象p从对象q出发时是直接密度可达的。

(6)密度可达:如果存在一个对象链p1,…,pi,…,pn,满足p1=p和pn=q,pi是从pi+1关于Eps和minPts直接密度可达的,则对象p是从对象q关于Eps和minPts密度可达的。

(7)密度相连:如果存在对象O∈D,使对象p和q都是从O关于Eps和minPts密度可达的,那么对象p到q是关于Eps和minPts密度相连的。

(8)类:为非空集合,满足密度可达且密度相连。

有关核心点、边界点、噪声点以及直接密度可达、密度可达和密度相连解释如图9-2所示。

图9-2中的红色为核心点,黄色为边界点,蓝色为噪声点,minPts=4,Eps是图中圆的半径大小。有关“直接密度可达”和“密度可达”定义的实例如图9-3所示。其中,Eps用一个相应的半径表示,设minPts=3。

图9-2 DBSCAN基本概念(见彩插)

图9-3  “直接密度可达”和“密度可达”概念示意描述

根据前面基本概念的描述知道:由于有标记的各点M、P、O和R的Eps近邻均包含三个以上的点,因此它们都是核对象;M是从P“直接密度可达”;而Q则是从M“直接密度可达”;基于上述结果,Q是从P“密度可达”;但P从Q无法“密度可达”(非对称)。类似地,S和R从O是“密度可达”的;O、R和S均是“密度相连”(对称)的。