首页|密集视频描述中单词级遗忘度优化算法

密集视频描述中单词级遗忘度优化算法

Word-level Forgetfulness Optimization Algorithm for Dense Video Description

扫码查看
针对密集视频描述在文本生成过程中存在部分单词错误和缺失的问题,提出密集视频描述中单词级遗忘度优化算法(WFO).通过调整遗忘度曲线斜率优化Transformer解码器中多头注意力输出的权重和文本序列,增强文本向量中局部语义信息的关注度,提高注意力机制对时态逻辑信息的捕捉,使生成的描述文本兼顾语句表达的准确性和单词构成的丰富性,更贴合视频内容,进而提高视频描述性能.实验结果表明,在Charades数据集上,与视频多样性描述算法相比,本文算法生成的描述语句在准确性和多样性上均有明显提升,其中准确性平均提高1.51%,多样性平均提高4.48%.

盘晓芳、杨大伟、毛琳

展开 >

大连民族大学 机电工程学院,辽宁 大连116605

密集视频描述 单词级 遗忘度

国家自然科学基金辽宁省自然科学基金辽宁省自然科学基金

61673084201805508662020-MZLH-24

2022

大连民族大学学报
大连民族学院

大连民族大学学报

CHSSCD
影响因子:0.266
ISSN:1009-315X
年,卷(期):2022.24(3)
  • 2