首页|混合高斯变分自编码器的聚类网络

混合高斯变分自编码器的聚类网络

扫码查看
目的 经典的聚类算法在处理高维数据时存在维数灾难等问题,使得计算成本大幅增加并且效果不佳.以自编码或变分自编码网络构建的聚类网络改善了聚类效果,但是自编码器提取的特征往往比较差,变分自编码器存在后验崩塌等问题,影响了聚类的结果.为此,本文提出了一种基于混合高斯变分自编码器的聚类网络.方法 使用混合高斯分布作为隐变量的先验分布构建变分自编码器,并以重建误差和隐变量先验与后验分布之间的KL散度(Kullback-Leibler divergence)构造自编码器的目标函数训练自编码网络;以训练获得的编码器对输入数据进行特征提取,结合聚类层构建聚类网络,以编码器隐层特征的软分配分布与软分配概率辅助目标分布之间的KL散度构建目标函数并训练聚类网络;变分自编码器采用卷积神经网络实现.结果 为了验证本文算法的有效性,在基准数据集MNIST(Modified National Institute of Standards and Technology Database)和Fashion-MNIST上评估了该网络的性能,聚类精度(accuracy,ACC)和标准互信息(normalized mutual information,NMI)指标在MNIST数据集上分别为95.86%和91%,在Fashion-MNIST数据集上分别为61.34%和62.5%,与现有方法相比性能有了不同程度的提升.结论 实验结果表明,本文网络取得了较好的聚类效果,且优于当前流行的多种聚类方法.
A Gaussian mixture variational autoencoder based clustering network

陈华华、陈哲、郭春生、应娜、叶学义

展开 >

杭州电子科技大学通信工程学院, 杭州 310018

聚类 混合高斯分布 变分自编码器(VAE) 软分配 KL散度

浙江省"领雁"研发攻关计划

2022C03065

2022

中国图象图形学报
中国科学院遥感应用研究所,中国图象图形学学会 ,北京应用物理与计算数学研究所

中国图象图形学报

CSTPCDCSCD北大核心
影响因子:1.111
ISSN:1006-8961
年,卷(期):2022.27(7)
  • 1
  • 5