首页|基于Schatten-p范数的低秩子空间聚类模型及应用研究

基于Schatten-p范数的低秩子空间聚类模型及应用研究

扫码查看
随着互联网、云计算等先进技术的快速发展,人们获得的数据越来越呈现高维特点.如何从这些高维数据中获取想要的有效信息是一个具有重要意义的课题.子空间聚类是一种能有效处理高维数据的聚类分析方法,目前已广泛应用于计算机视觉、图像处理和模式识别等领域.低秩表示(LowRankRepresentation,LRR)是一种经典的基于自表示的子空间聚类方法,但它存在数据采样不足和严重损坏等严峻问题.隐式低秩表示(LatentLowRankRepresentation,LLRR)同时考虑可观测数据和不可观测数据,克服了上述困难.然而,LLRR采用凸核范数实现低秩约束,忽视了不同奇异值间的差异性,进而导致学习到的低秩表示系数矩阵不能准确地刻画数据的类别结构.大量研究和实验证明,非凸函数可以更精确逼近秩函数.但是,在求解这些基于非凸正则项模型过程中,通常没有闭式解,且时间成本较大.针对上述问题,本文提出两种新的基于非凸Schatten-p范数与LLRR模型用于子空间聚类,并设计了有效的迭代优化求解算法,主要的工作如下: (1)针对LLRR使用凸核范数对所有奇异值进行相同处理,忽略了不同奇异值的差异性,使学习到的表示系数矩阵不能准确地刻画数据的类别结构这一问题,本文使用非凸加权Schatten-p范数(WeightedSchatten-pNorm,WSN)逼近秩函数,设计了一种基于非凸加权Schatten-p范数和隐式低秩表示的鲁棒子空间聚类方法(RobustSubspaceClusteringBasedonLatentLowRankRepresentationwithWeightedSchatten-pNorm,WSN-LLRR),利用交替方向乘子法(AlternatingDirectionMethodofMultipliers,ADMM)框架设计了一种高效的迭代优化求解算法对所提出的非凸优化问题进行求解.该方法扩展于LLRR,利用了不可观测数据,能有效克服采样不足问题以及提高算法对噪声和损坏的鲁棒性.同时明确考虑了不同奇异值的差异性,能更精确诱导表示系数矩阵的低秩结构.通过挖掘低秩表示的主方向的角信息构造用于谱聚类的相似度矩阵,进一步提升子空间聚类性能.大量的实验结果验证了所提方法的有效性. (2)针对非凸WSN的阈值函数只能得到近似解且时间成本较大等问题,本文提出使用非凸变换Schatten-1(TransformedSchatten-1,TS1)函数近似子空间表示系数矩阵的秩,设计了一种基于非凸TS1函数和隐式低秩表示的鲁棒子空间聚类方法(RobustSubspaceClusteringBasedonLatentLowRankRepresentationwithTS1Function,TS1-LLRR),利用ADMM框架给出了有效的迭代优化求解算法.一方面,TS1-LLRR由LLRR扩展而来,具有较好的鲁棒性.另一方面,TS1函数能很好地估计秩函数,且其阈值函数在参数区间α∈(0,+∞)均存在闭式解,这使得在优化TS1-LLRR模型过程中得到的每个子问题均存在闭式解,保证了其解的准确性且求解时间相对较短.通过一些关于低秩表示的后处理技术构造相似度矩阵,进一步增强了揭示数据点间内在相关性的能力.大量在人脸、物体聚类和运动分割的实验结果表明所提方法的优越性.

瞿勤

展开 >

子空间聚类 隐式低秩表示 加权Schatten-p范数 非凸优化 高维数据

硕士

计算机科学与技术

陈武;王智

2023

西南大学

中文

TP