基于高阶信息的特征提取算法及其在图像识别中的应用

张蕊¹

扫码查看

作者信息

1. 南京航空航天大学研究生院计算机科学与技术学院
折叠

摘要

随着科技的迅速发展，图片数据的规模已有着指数级增长的趋势，影响图像识别算法的数据的维度、复杂度及多样性等因素也今非昔比，所以利用特征提取算法从如此大规模的高维度数据中获取最有效的特征信息仍是近年来的研究热点。然而大多数的特征提取方法只关注数据的一阶局部结构信息，显然无法应对现实中高维且复杂的图像数据。近年来，高阶信息受到了学者们的关注，它能表达出数据更具判别性、更本质的结构，从而在特征提取时发掘高阶结构对提高图像识别的性能是十分有意义的。本文针对图像识别中的不同任务和场景，提出三种基于高阶信息的特征提取算法。首先，为了同时利用数据中的全局信息和高阶局部信息提出了一个基于低秩表示的特征提取算法。全局信息是通过模型中的低秩约束来实现，同时该约束还能使模型避免受到噪声和离群点的影响，提高模型的鲁棒性。局部信息则是通过基于图的流行嵌入来实现的。通过构建一阶、二阶图矩阵使得模型能同时保持样本间的对结构和有序结构。在十个公开的图像数据集上进行的对比实验证明了本方法相对于传统及最新方法在识别准确率指标下有着明显的提升。其次，为了解决多模态数据中的不平衡问题而提出了自步有序保持算法。从特征层面来看，该算法利用了二阶拉普拉斯流形嵌入使得不同模态数据的有序结构保持到新的投影空间中。从样本层面来看，我们设计了分别针对多数类和少数类的自步学习策略，将参与学习的数据从类别平衡的子集动态地扩充到整个集合，减少不平衡类别对模型学习的负面影响。同时，在投影矩阵上施加的组稀疏约束可以发掘不同模态之间的潜在关系模式。在多模态图像数据集913-ADNI和癫痫数据上的实验结果表明，本文提出的方法能达到很好的分类和诊断效果。最后，考虑到传统的模型不能直接识别出来自新类别的样本，即无法适用于零样本识别，本文提出了针对该场景的语义引导的高阶区域注意力嵌入模型。该模型以端到端的方式进行训练，能够利用不同的注意力模块获得全局特征和局部区域特征。最后的二阶池化操作能提取出两种特征的二阶信息。在零样本任务常用的四个数据集上的实验表明，本模型在零样本学习任务中可以取得理想的分类结果。

关键词

高阶信息/特征提取/图像识别/多模态不平衡/零样本学习

引用本文复制引用

授予学位

硕士

学科专业

计算机科学与技术

导师

朱旗/黄圣君

学位年度

2021

学位授予单位

南京航空航天大学

语种

中文

中图分类号

段落导航