一种基于柯西分布的视频关键帧提取方法

扫码查看

原文链接

NETL
NSTL
万方数据

中文摘要：自然视频包含的众多事件间存在着关联性和时序上的重叠特征,导致视频帧的描述语句缺乏逻辑性,且存在语义离散、主题模糊的问题.为此,采用混合 2D/3D卷积网络提取视频帧的全局特征,通过柯西分布分析视频事件的时序关联性,获取事件的相关帧,称为T-MCD.实验表明,T-MCD在执行Charades数据集的视频帧描述任务时,BLEU(bilingual evaluation understudy)4个指标均优于其他方法,且CIDEr(consensus-based image description evaluation)指标高达0.181,效果较好.

作者：

唐雅媛、胡斌、朱晓溪、冯俊智

展开 >

作者单位：

湖南科技学院信息工程学院,湖南永州 425199

中南大学计算机学院,湖南长沙 410083

上海立达学院数字科学学院,上海 201609

关键词：

混合2D/3D卷积网络柯西分布关键帧

出版年：

2024

湖南科技学院学报

湖南科技学院

湖南科技学院学报

影响因子：0.247

ISSN：1673-2219

年,卷(期)：2024.45(5)

浏览量3