基于多模态特征融合的高效性语义视频检索系统

庄海¹

扫码查看

作者信息

1. 海南广播电视总台
折叠

摘要

本文以"视听海南"APP为例,提出了一种基于多模态特征融合的高效性语义视频检索系统.该系统采用无监督的DBSCAN聚类分析,从高维度视频帧内容编码中筛选关键帧,并引入注意力机制和掩体动作来识别预训练网络组成的并行编码器,捕捉图像的局部空间和动作信息,利用对抗生成网络和三元组损失函数优化不同模态特征的对齐,实现高效且准确的视频检索服务.

关键词

多模态/视频检索/特征融合/聚类分析

引用本文复制引用

出版年

2024

广播电视信息

国家广电总局无线电台管理局,中国有线电视网络有限公司

广播电视信息

影响因子：0.242

ISSN：1007-1997

参考文献量2

段落导航