国家学术搜索
登录
注册
中文
EN
首页
|
基于多模态特征融合的高效性语义视频检索系统
基于多模态特征融合的高效性语义视频检索系统
引用
认领
扫码查看
点击上方二维码区域,可以放大扫码查看
原文链接
NETL
NSTL
万方数据
中文摘要:
本文以"视听海南"APP为例,提出了一种基于多模态特征融合的高效性语义视频检索系统.该系统采用无监督的DBSCAN聚类分析,从高维度视频帧内容编码中筛选关键帧,并引入注意力机制和掩体动作来识别预训练网络组成的并行编码器,捕捉图像的局部空间和动作信息,利用对抗生成网络和三元组损失函数优化不同模态特征的对齐,实现高效且准确的视频检索服务.
收起全部
展开查看外文信息
作者:
庄海
展开 >
作者单位:
海南广播电视总台
关键词:
多模态
视频检索
特征融合
聚类分析
出版年:
2024
广播电视信息
国家广电总局无线电台管理局,中国有线电视网络有限公司
广播电视信息
影响因子:
0.242
ISSN:
1007-1997
年,卷(期):
2024.
31
(8)
参考文献量
2