用于多模态语义分析的嵌入共识自动编码器

Embedding Consensus Autoencoder for Cross-modal Semantic Analysis

孙圣姿 ¹郭炳晖 ²杨小博³

扫码查看

作者信息

1. 北京航空航天大学大数据与脑机智能高精尖中心北京 100191
2. 鹏程实验室广东深圳 518055
3. 教育部数学信息与行为重点实验室和北京航空航天大学数学科学学院北京 100191
折叠

摘要

跨模态检索技术是一项近年来的研究热点.多模态数据具有异质性,而不同形式的信息之间又有着相似性.传统的单模态方法只能以一种方式重构原始数据,并未考虑到不同数据之间的语义相似性,不能进行有效的检索.因此,文中建立了一个跨模态嵌入共识自动编码器(Cross-Modal Semantic Autoencoder with Embedding Consensus,ECA-CMSA),将原始数据映射到低维共识空间以保留语义信息,学习出对应的语义代码向量,并引入参数来实现去噪.然后,考虑到各模态之间的相似性,采用自动编码器将特征投影关联到语义代码向量.此外,对低维矩阵进行正则化稀疏约束,以平衡重构误差.在4个多模态数据集上验证所提方法的性能,实验结果证明其查询结果有所提升,实现了有效的跨模态检索.进一步,ECA-CMSA还可以应用于与计算机和网络有关的领域,如深度学习和子空间学习.该模型突破了传统方法中的障碍,创新地使用深度学习方法将多模态数据转换为抽象的表达,使其可以获得更好的准确度和识别结果.

关键词

多模态检索/嵌入共识/自动编码器/稀疏正则

引用本文复制引用

基金项目

出版年

2021

计算机科学

重庆西南信息有限公司（原科技部西南信息中心）

计算机科学

CSTPCDCSCD北大核心

影响因子：0.944

ISSN：1002-137X

被引量1

参考文献量19

段落导航