华南理工大学学报(自然科学版)2022,Vol.50Issue(6) :1-9.DOI:10.12141/j.issn.1000-565X.210709

基于度量学习的跨模态人脸检索算法

A Cross-Modal Face Retrieval Algorithm Based on Metric Learning

沃焱 梁籍云 韩国强
华南理工大学学报(自然科学版)2022,Vol.50Issue(6) :1-9.DOI:10.12141/j.issn.1000-565X.210709

基于度量学习的跨模态人脸检索算法

A Cross-Modal Face Retrieval Algorithm Based on Metric Learning

沃焱 1梁籍云 1韩国强1
扫码查看

作者信息

  • 1. 华南理工大学 计算机科学与工程学院, 广东 广州510006
  • 折叠

摘要

现有基于度量学习的跨模态检索算法用于跨模态人脸检索任务时缺乏对视角差异和域差异的关注,并且在度量学习过程中缺乏对全局信息的学习,构建了大量的冗余三元组.为此,文中提出了一种基于度量学习的跨模态共同表达生成算法,采用偏航角等变模块补偿偏航角差异以获取具有鲁棒性的图像特征,使用多层注意力机制获取具有可分性的视频特征;使用全局三元组和局部三元组共同训练跨模态共同表达生成网络,以提升度量学习的一致性和准确性,同时通过半困难三元组筛选来加速损失函数的收敛;提出了结合域校准和迁移学习的域适应算法,以提升共同表达的泛化性.在PB、YTC和UMD人脸视频数据集上的实验结果表明,文中算法有效地提升了跨模态人脸检索的准确性,通过少数样本微调跨模态共同表达生成网络,可有效提升目标域图像跨模态检索的准确性.

关键词

度量学习/跨模态检索/注意力机制/深度学习

引用本文复制引用

基金项目

广东省自然科学基金(2021A1515012020)

广州市科技计划(202002030298)

出版年

2022
华南理工大学学报(自然科学版)
华南理工大学

华南理工大学学报(自然科学版)

CSTPCDCSCD北大核心
影响因子:0.678
ISSN:1000-565X
参考文献量20
段落导航相关论文