首页|基于潜在空间的低秩稀疏表示子空间聚类研究

基于潜在空间的低秩稀疏表示子空间聚类研究

扫码查看
随着移动互联网的迅速发展,各类移动终端每天都会产生大量高维数据,比如视频图像数据。为了挖掘这些数据的内在价值,通常会使用聚类对这些数据进行初步分析。然而,由于高维数据中包含大量与聚类任务无关的特征,直接使用传统的聚类算法处理这些高维数据可能会引发“维数灾难”问题。幸运的是,子空间聚类算法能够较好地处理高维数据聚类问题,尤其是基于低秩表示或者稀疏表示的子空间聚类算法,因其良好的高维数据聚类表现获得了大量研究人员的关注。然而这些算法也存在一些不足,比如潜在空间低秩稀疏子空间聚类算法在潜在空间中保持高维数据的全局结构不太合理,子空间聚类算法难以处理非线性结构数据等。针对这些不足,本文对现有的算法进行改进,通过理论分析和实验比较证明了所提出算法的有效性。本文的主要工作和创新点如下: (1)针对潜在空间低秩稀疏子空间聚类算法求解的潜在空间保持高维数据的全局结构不太合理的问题,提出了基于图约束的鲁棒潜在空间低秩稀疏子空间聚类算法。该算法能够同时得到一个低秩稀疏表示和一个低维的潜在空间,并使用图约束项来保持原始数据的局部流形结构,以获得具有判别性的潜在空间。为了使模型对噪声鲁棒,该算法使用F范数和ι1范数或者ι2,1范数捕捉噪声和离群样本。大量的实验验证了本文提出的算法相比于其他基于低秩表示或者稀疏表示的子空间聚类算法,具有更加优越的表现。 (2)针对(1)无法处理非线性结构数据聚类的问题,将(1)和深度学习结合起来,提出了一个基于图约束的潜在空间深度子空间聚类模型。该模型利用F范数和ι1范数使得表示矩阵具有低秩性和稀疏性,同时利用图约束使得学得的潜在空间能够保持原始数据的局部流形结构。实验验证了该模型能够较好地处理非线性结构的数据集,并且求得的潜在空间能够保持原始数据的局部流形结构。

肖云军

展开 >

空间聚类 潜在空间 子空间聚类 低秩稀疏表示 深度子空间聚类

硕士

计算机技术

韦佳、张加佳

2020

华南理工大学

中文

TP