重庆理工大学学报2021,Vol.35Issue(10) :180-186.DOI:10.3969/j.issn.1674-8425(z).2021.10.023

基于邻域密度的K-means初始聚类中心优选方法

An Optimization Method for Initial Clustering Centers of K-means Based on Neighborhood Density

雒明雪 苑迎春 陈江薇 王克俭
重庆理工大学学报2021,Vol.35Issue(10) :180-186.DOI:10.3969/j.issn.1674-8425(z).2021.10.023

基于邻域密度的K-means初始聚类中心优选方法

An Optimization Method for Initial Clustering Centers of K-means Based on Neighborhood Density

雒明雪 1苑迎春 1陈江薇 2王克俭1
扫码查看

作者信息

  • 1. 河北农业大学 信息科学与技术学院,河北 保定 071000
  • 2. 河北农业大学 教务处,河北 保定 071000
  • 折叠

摘要

传统K-means算法初始聚类中心的选择具有随机性且对离群点敏感,导致聚类结果不稳定、准确率低等问题.针对上述问题,提出基于邻域密度的NDK-means算法.首先,通过多维网格划分得到样本的网格分布特性;然后,通过定义网格密度和网格邻域密度,确定多个局部高密度网格,同时引入迭代因子合并相邻高密度网格中心得到初始聚类中心候选集;最后,结合网格密度和距离,利用最大最小距离算法得到K个初始聚类中心.在UCI数据集上进行实验,实验结果表明:相对于其他局部邻域算法,新算法提高了聚类结果的准确率,具有较好的稳定性.

关键词

多维网格/网格邻域/K-means算法/最大最小距离

引用本文复制引用

基金项目

河北省高等教育教学改革研究与实践项目(2018GJJG140)

出版年

2021
重庆理工大学学报
重庆理工大学

重庆理工大学学报

CSTPCD北大核心
影响因子:0.567
ISSN:1674-8425
被引量3
参考文献量13
段落导航相关论文