广播电视信息2024,Vol.31Issue(8) :16-18.

基于多模态特征融合的高效性语义视频检索系统

庄海
广播电视信息2024,Vol.31Issue(8) :16-18.

基于多模态特征融合的高效性语义视频检索系统

庄海1
扫码查看

作者信息

  • 1. 海南广播电视总台
  • 折叠

摘要

本文以"视听海南"APP为例,提出了一种基于多模态特征融合的高效性语义视频检索系统.该系统采用无监督的DBSCAN聚类分析,从高维度视频帧内容编码中筛选关键帧,并引入注意力机制和掩体动作来识别预训练网络组成的并行编码器,捕捉图像的局部空间和动作信息,利用对抗生成网络和三元组损失函数优化不同模态特征的对齐,实现高效且准确的视频检索服务.

关键词

多模态/视频检索/特征融合/聚类分析

引用本文复制引用

出版年

2024
广播电视信息
国家广电总局无线电台管理局,中国有线电视网络有限公司

广播电视信息

影响因子:0.242
ISSN:1007-1997
参考文献量2
段落导航相关论文