DBSCAN(Density-Based Spatial Clustering of Applications with Noise)是一种基于密度的聚类算法:把数据中“足够密集”的点归为同一簇,并将孤立点视为噪声/离群点。常用于发现任意形状的簇,且不必预先指定簇的数量。
/ˌdiː.biːˈskæn/
DBSCAN can find clusters without knowing the number of clusters in advance.
DBSCAN 可以在不预先知道簇数量的情况下找到聚类结果。
Using DBSCAN with carefully chosen epsilon and minPts, the analyst clustered GPS traces into meaningful routes while filtering out sporadic noise points.
通过为 DBSCAN 细致选择 epsilon 和 minPts,分析师将 GPS 轨迹聚成有意义的路线,同时过滤掉零散的噪声点。
DBSCAN 是一个缩写,来自 Density-Based Spatial Clustering of Applications with Noise(“带噪声的应用的基于密度的空间聚类”)。它由 Martin Ester、Hans-Peter Kriegel、Jörg Sander 和 Xiaowei Xu 于 1996 年提出,核心思想是用“邻域内点的密度”来决定簇的扩展,并显式标记噪声点。