计算机研究与发展2023,Vol.60Issue(11) :2660-2670.DOI:10.7544/issn1000-1239.202220430

面向科技资讯的基于语义对抗和媒体对抗的跨媒体检索方法

Scientific and Technological Information Oriented Semantics-Adversarial and Media-Adversarial Based Cross-Media Retrieval Method

李昂 杜军平 寇菲菲 薛哲 徐欣 许明英 姜阳
计算机研究与发展2023,Vol.60Issue(11) :2660-2670.DOI:10.7544/issn1000-1239.202220430

面向科技资讯的基于语义对抗和媒体对抗的跨媒体检索方法

Scientific and Technological Information Oriented Semantics-Adversarial and Media-Adversarial Based Cross-Media Retrieval Method

李昂 1杜军平 1寇菲菲 1薛哲 1徐欣 1许明英 1姜阳1
扫码查看

作者信息

  • 1. 北京邮电大学计算机学院(国家示范性软件学院) 北京 100876;智能通信软件与多媒体北京市重点实验室(北京邮电大学)北京 100876
  • 折叠

摘要

科技资讯跨媒体检索是跨媒体领域的重要任务之一,面临着多媒体数据间异构鸿沟和语义鸿沟亟待打破的难题.通过跨媒体科技资讯检索,用户能够从多源异构的海量科技资源中获取目标科技资讯.这有助于设计出符合用户需求的应用,包括科技资讯推荐、个性化科技资讯检索等.跨媒体检索研究的核心是学习一个公共子空间,使得不同媒体的数据在该子空间中可以直接相互比较.在子空间学习中,现有方法往往聚焦于建模媒体内数据的判别性和媒体间数据在映射后的不变性,却忽略了媒体间数据在映射前后的语义一致性和语义内的媒体判别性,使得跨媒体检索效果存在局限性.鉴于此,提出一种面向科技资讯的基于语义对抗和媒体对抗的跨媒体检索方法(SMCR),寻找可供映射的有效公共子空间.具体而言,SMCR在建模媒体内语义判别性之外,将媒体间语义一致性损失最小化,以保留映射前后的语义相似性.此外,SMCR构建基础特征映射网络和精炼特征映射网络,联合最小化语义内的媒体判别性损失,有效增强了特征映射网络混淆媒体判别网络的能力.在 2个数据集上的大量实验结果表明,所提出的SMCR方法在跨媒体检索中的表现优于最前沿的方法.

关键词

跨媒体检索/对抗学习/科技资讯/媒体约束/语义一致性

Key words

cross-media retrieval/adversarial learning/scientific and technological information/media constraint/semantic consistency

引用本文复制引用

基金项目

国家自然科学基金重大项目(62192784)

青年人才托举工程项目(第八届)(2022QNRC001)

出版年

2023
计算机研究与发展
中国科学院计算技术研究所 中国计算机学会

计算机研究与发展

CSTPCDCSCD北大核心
影响因子:2.649
ISSN:1000-1239
参考文献量5
段落导航相关论文