为什么还需要DBSCAN聚类算法?
发布时间:2021-02-24 14:26:00 所属栏目:动态 来源:互联网
导读:基于密度的聚类算法 基于密度的聚类是无监督学习法,基于数据空间中的聚类是高点密度的连续区域,通过低点密度的连续区域与其他此类聚类分离,来识别数据中独特的组/聚类。 具有噪声的基于密度的聚类方法(DBSCAN)是基于密度聚类的一种基本算法。它可以从大量
基于密度的聚类算法 基于密度的聚类是无监督学习法,基于数据空间中的聚类是高点密度的连续区域,通过低点密度的连续区域与其他此类聚类分离,来识别数据中独特的组/聚类。 具有噪声的基于密度的聚类方法(DBSCAN)是基于密度聚类的一种基本算法。它可以从大量的数据中发现不同形状和大小的聚类,这些聚类中正包含着噪声和异常值。 DBSCAN算法使用以下两种参数:
如果探究两个称为密度可达性(DensityReachability)和密度连接性(DensityConnectivity)的概念,就可以理解这些参数。 密度方面的可达性(Reachability)建立了一个可以到达另一个点的点,如果该点位于与另一个点的特定距离(eps)内。 连接性(Connectivity)涉及到基于传递性的链接方法,以确定点是否位于特定的聚类中。例如,如果p->r->s->t->q,则p和q可以连接,其中a->b表示b在a的邻域内。
DBSCAN聚类完成后会产生三种类型的点: (编辑:济源站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |