基于重构误差的深度聚类方法

Deep Clustering Method Based on Reconstruction Error

邓祥 ¹俞璐 ¹谢钧 ¹吕昊远 ¹姚昌华²

扫码查看

作者信息

1. 陆军工程大学,江苏南京 210001
2. 南京信息工程大学,江苏南京 210044
折叠

摘要

聚类是机器学习的核心任务之一,通常是在无标签条件下,依靠发掘数据潜在的结构进行聚类.近年来,数据的复杂度越来越高,数据隐空间中存在各种冗余复杂的空间结构,传统聚类算法难以从中分离出不同簇的数据.深度学习具有强大的特征表示和非线性逼近能力,在无监督聚类领域也显现出优越性,基于深度学习的聚类模型有效提高了各类复杂数据的聚类结果.该文提出了一种新的端到端深度聚类模型,在自编码器框架下,构建多个不同的聚类子空间,并利用高维样本在多个子空间的低维特征重构原始样本,同时增加一个对样本进行簇预测的网络,利用预测的概率向量对不同簇的解码样本进行加权融合,通过最小化融合样本与原始样本之间的重构误差并对子空间加以约束,最终实现对高维样本的聚类.模型同时兼顾聚类簇的子空间结构和不同簇之间的重构误差,在标准数据集上取得了较好的聚类效果.

关键词

聚类/深度聚类/深度学习/自编码器/模式识别

引用本文复制引用

基金项目

国家自然科学基金面上项目(61971439)

江苏省自然科学基金面上项目(BK20191329)

中国博士后科学基金(2019T120987)

出版年

2022

计算机技术与发展

陕西省计算机学会

计算机技术与发展

CSTPCD

影响因子：0.621

ISSN：1673-629X

参考文献量28

段落导航