首页|基于多模态特征融合的高效性语义视频检索系统

基于多模态特征融合的高效性语义视频检索系统

扫码查看
本文以"视听海南"APP为例,提出了一种基于多模态特征融合的高效性语义视频检索系统.该系统采用无监督的DBSCAN聚类分析,从高维度视频帧内容编码中筛选关键帧,并引入注意力机制和掩体动作来识别预训练网络组成的并行编码器,捕捉图像的局部空间和动作信息,利用对抗生成网络和三元组损失函数优化不同模态特征的对齐,实现高效且准确的视频检索服务.

庄海

展开 >

海南广播电视总台

多模态 视频检索 特征融合 聚类分析

2024

广播电视信息
国家广电总局无线电台管理局,中国有线电视网络有限公司

广播电视信息

影响因子:0.242
ISSN:1007-1997
年,卷(期):2024.31(8)
  • 2