计算机技术与发展2023,Vol.33Issue(11) :156-161.DOI:10.3969/j.issn.1673-629X.2023.11.023

基于类间相似性的聚类集成方法

Clustering Ensemble Method Based on Similarity Between Clusters

张栋超 蔡江辉 杨海峰 郑爱宇
计算机技术与发展2023,Vol.33Issue(11) :156-161.DOI:10.3969/j.issn.1673-629X.2023.11.023

基于类间相似性的聚类集成方法

Clustering Ensemble Method Based on Similarity Between Clusters

张栋超 1蔡江辉 1杨海峰 1郑爱宇1
扫码查看

作者信息

  • 1. 太原科技大学 计算机科学与技术学院,山西 太原 030024
  • 折叠

摘要

聚类集成是聚类的一个重要分支,它用于融合多个基聚类,来生成具有鲁棒性和高质量的最终聚类划分.将原始信息转化为共协矩阵,通过共协矩阵得到最终聚类划分的聚类集成方法是目前很多研究者研究的内容,然而大多数研究者都忽略了聚类结果容易受到噪声的影响,且忽略了共协矩阵在数据量大时,时间以及空间复杂度高的问题.为了解决以上问题,该文设计了一种基于类间相似性的聚类集成方法(CSCE).该方法首先基于证据积累模型找到原始对象之间的相似性,将原始对象划分为多个小簇.然后通过一种新的相似度计算方法,计算簇与簇之间的相似度,形成簇与簇的相似矩阵.最后通过归一化切割(NCUT)切图的方法,将簇相似矩阵划分为最终聚类结果.该方法将低质量异常对象按相似度并入与之相似的簇中,并在8 个数据集上进行了实验.结果表明,该方法不仅聚类效果好,而且解决了传统共协矩阵时间以及空间复杂度高的问题.

关键词

聚类集成/共协矩阵/基聚类/证据积累/复杂度

Key words

clustering ensemble/co-association matrix/base clusters/evidence accumulation/complexity

引用本文复制引用

基金项目

国家自然科学基金(U1931209)

出版年

2023
计算机技术与发展
陕西省计算机学会

计算机技术与发展

CSTPCD
影响因子:0.621
ISSN:1673-629X
参考文献量2
段落导航相关论文