首页|一种基于柯西分布的视频关键帧提取方法

一种基于柯西分布的视频关键帧提取方法

扫码查看
自然视频包含的众多事件间存在着关联性和时序上的重叠特征,导致视频帧的描述语句缺乏逻辑性,且存在语义离散、主题模糊的问题.为此,采用混合 2D/3D卷积网络提取视频帧的全局特征,通过柯西分布分析视频事件的时序关联性,获取事件的相关帧,称为T-MCD.实验表明,T-MCD在执行Charades数据集的视频帧描述任务时,BLEU(bilingual evaluation understudy)4个指标均优于其他方法,且CIDEr(consensus-based image description evaluation)指标高达0.181,效果较好.

唐雅媛、胡斌、朱晓溪、冯俊智

展开 >

湖南科技学院 信息工程学院,湖南 永州 425199

中南大学 计算机学院,湖南 长沙 410083

上海立达学院 数字科学学院,上海 201609

混合2D/3D卷积网络 柯西分布 关键帧

2024

湖南科技学院学报
湖南科技学院

湖南科技学院学报

影响因子:0.247
ISSN:1673-2219
年,卷(期):2024.45(5)
  • 3