计算机科学2021,Vol.48Issue(3) :151-157.DOI:10.11896/jsjkx.200100112

基于自然最近邻的密度峰值聚类算法

Density Peaks Clustering Algorithm Based on Natural Nearest Neighbor

汤鑫瑶 张正军 储杰 严涛
计算机科学2021,Vol.48Issue(3) :151-157.DOI:10.11896/jsjkx.200100112

基于自然最近邻的密度峰值聚类算法

Density Peaks Clustering Algorithm Based on Natural Nearest Neighbor

汤鑫瑶 1张正军 1储杰 1严涛1
扫码查看

作者信息

  • 1. 南京理工大学理学院 南京 210094
  • 折叠

摘要

针对密度峰值聚类算法(Density Peaks Clustering,DPC)需要人为指定截断距离dc,以及局部密度定义简单和一步分配策略导致算法在复杂数据集上表现不佳的问题,提出了一种基于自然最近邻的密度峰值聚类算法(Density Peaks Clustering based on Natural Nearest Neighbor,NNN-DPC).该算法无需指定任何参数,是一种非参数的聚类方法.该算法首先根据自然最近邻的定义,给出新的局部密度计算方法来描述数据的分布,揭示内在的联系;然后设计了两步分配策略来进行样本点的划分.最后定义了簇间相似度并提出了新的簇合并规则进行簇的合并,从而得到最终聚类结果.实验结果表明,在无需参数的情况下,NNN-DPC算法在各类数据集上都有优秀的泛化能力,对于流形数据或簇间密度差异大的数据能更加准确地识别聚类数目和分配样本点.与DPC、FKNN-DPC(Fuzzy Weighted K-nearest Density Peak Clustering)以及其他3种经典聚类算法的性能指标相比,NNN-DPC算法更具优势.

关键词

聚类算法/自然最近邻居/密度峰值/局部密度

引用本文复制引用

基金项目

国家自然科学基金(11671205)

出版年

2021
计算机科学
重庆西南信息有限公司(原科技部西南信息中心)

计算机科学

CSTPCDCSCD北大核心
影响因子:0.944
ISSN:1002-137X
被引量8
参考文献量2
段落导航相关论文