加入收藏 | 设为首页 | 会员中心 | 我要投稿 济源站长网 (https://www.0391zz.cn/)- 数据工具、数据仓库、行业智能、CDN、运营!
当前位置: 首页 > 站长资讯 > 动态 > 正文

为什么还需要DBSCAN聚类算法?

发布时间:2021-02-24 14:26:00 所属栏目:动态 来源:互联网
导读:基于密度的聚类算法 基于密度的聚类是无监督学习法,基于数据空间中的聚类是高点密度的连续区域,通过低点密度的连续区域与其他此类聚类分离,来识别数据中独特的组/聚类。 具有噪声的基于密度的聚类方法(DBSCAN)是基于密度聚类的一种基本算法。它可以从大量

基于密度的聚类算法

基于密度的聚类是无监督学习法,基于数据空间中的聚类是高点密度的连续区域,通过低点密度的连续区域与其他此类聚类分离,来识别数据中独特的组/聚类。

具有噪声的基于密度的聚类方法(DBSCAN)是基于密度聚类的一种基本算法。它可以从大量的数据中发现不同形状和大小的聚类,这些聚类中正包含着噪声和异常值。

DBSCAN算法使用以下两种参数:

  • eps (ε):一种距离度量,用于定位任何点的邻域内的点。
  • minPts:聚类在一起的点的最小数目(一个阈值),使一个区域界定为密集。

如果探究两个称为密度可达性(DensityReachability)和密度连接性(DensityConnectivity)的概念,就可以理解这些参数。

密度方面的可达性(Reachability)建立了一个可以到达另一个点的点,如果该点位于与另一个点的特定距离(eps)内。

连接性(Connectivity)涉及到基于传递性的链接方法,以确定点是否位于特定的聚类中。例如,如果p->r->s->t->q,则p和q可以连接,其中a->b表示b在a的邻域内。

DBSCAN聚类完成后会产生三种类型的点:


(编辑:济源站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读