信息技术与信息化2024,Issue(11) :49-52.DOI:10.3969/j.issn.1672-9528.2024.11.011

基于重叠度的聚类数目判断指标

张娟 李娜
信息技术与信息化2024,Issue(11) :49-52.DOI:10.3969/j.issn.1672-9528.2024.11.011

基于重叠度的聚类数目判断指标

张娟 1李娜2
扫码查看

作者信息

  • 1. 太极计算机股份有限公司 北京 100012
  • 2. 江西省生态文明研究院 江西南昌 330036
  • 折叠

摘要

如今对于聚类问题,很多技术与模型都倾向于人为给定聚类数目.而现有的内部聚类判断指标更多考虑的是类内信息,忽略了类间信息,这导致指标的效果不理想,因此如何利用类间信息选择适当数量的聚类是聚类分析领域中广泛研究的问题.而基于重叠度聚类数目预测算法可以很好地解决这个问题.具体来说,首先使用基于改进过后高斯混合聚类算法对未标记的数据集进行预聚类;接着计算聚类类间的重叠,对重叠度的判断以确定和选择聚类的数量.其指标优势在于算法最大限度地减少了超参数的影响,并能够准确确定正确的聚类数.除此之外,所提出的指标还可以当作评判聚类结果的一种通用指标.经过大量实验表明,效果相对于同类型的方法有明显的提升.

关键词

深度学习/深度聚类/聚类数目

引用本文复制引用

出版年

2024
信息技术与信息化
山东电子学会

信息技术与信息化

影响因子:0.29
ISSN:1672-9528
段落导航相关论文