首页|一种三层加权文本聚类集成方法

一种三层加权文本聚类集成方法

扫码查看
为了提高聚类集成效果,本文设计了一种对点、簇、划分进行加权的统一框架,提出一种三层加权文本聚类集成方法。首先根据基聚类生成超图邻接矩阵,然后依次对点、簇、划分进行加权获得加权邻接矩阵,最后用层次凝聚聚类算法获得最终结果。在多个真实文本数据集上进行实验,结果表明,与未加权及其他层面加权相比,三层加权方法可以获得更好的聚类效果,三层加权相较于未加权的平均提升幅度为 12。02%;与近年来的其他8种加权方法相比,该方法在所有数据集上的平均排名位列第一,验证了本文方法的有效性。
A three-level weighted approach for text clustering ensemble
To improve the clustering ensemble effect,this paper designs a unified framework for weighted points,clusters and partitions,and proposes a three-level weighted approach for text clustering ensemble.Firstly,the hyper-graph adjacency matrix is generated according to the base clustering,and then the weighted adjacency matrix is ob-tained by successively weighting the points,clusters and partitions.Finally,the final result is obtained by the hierarchic-al condensation clustering algorithm.Experiments were carried out on multiple real text datasets.The results show that compared with the unweighted results and other level weighted results,this approach has better clustering effect.The av-erage increase of three-layer weighted compared with that unweighted is 12.02%.Compared with the other 8 weighted methods in recent years,the average ranking of this algorithm is the first in all datasets,which verifies the effectiveness of the proposed method.

text clusteringclustering ensembleweighted clustering ensemblethree-level weightingweighted cluster-ingmulti-level weightingcluster analysisunsupervised learning

李娜、徐森、徐秀芳、许贺洋、郭乃瑄、刘轩绮、周天

展开 >

盐城工学院 信息工程学院,江苏 盐城 224051

东南大学 计算机网络和信息集成教育部重点实验室,江苏南京 211189

哈尔滨工程大学 水声工程学院,黑龙江 哈尔滨 150001

文本聚类 聚类集成 加权聚类集成 三层加权 加权聚类 多层加权 聚类分析 无监督学习

国家自然科学基金项目江苏省高等学校自然科学研究面上项目未来网络科研基金项目盐城工学院研究生培养创新工程项目教育部产学研合作协同育人计划项目中央高校基本科研业务费专项江苏高校"青蓝工程"项目

6207621521KJD520006FNSRFP-2021-YB-46SJCX21_XZ018202102594034K93-9-2022-03

2024

智能系统学报
中国人工智能学会 哈尔滨工程大学

智能系统学报

CSTPCD北大核心
影响因子:0.672
ISSN:1673-4785
年,卷(期):2024.19(4)