基于融合注意力机制的图像标题生成

Image caption generation based on fusion attention mechanism

侯一雯 ¹田玉玲¹

扫码查看

作者信息

1. 太原理工大学信息与计算机学院,太原030000
折叠

摘要

图像标题生成利用机器自动产生描述图像的句子,属于计算机视觉与自然语言处理的交叉领域.传统基于注意力机制的算法侧重特征图不同区域,忽略特征图通道,易造成注意偏差.该模型通过当前嵌入单词与隐藏层状态的耦合度来赋予特征图不同通道相应权重,并将其与传统方法结合为融合注意力机制,准确定位注意位置.实验结果均在指定的评估方法上有一定的提升,表明该模型可以生成更加流利准确的自然语句.

关键词

图像标题生成/注意偏差/通道/耦合度/融合注意力

引用本文复制引用

基金项目

国家自然科学基金(61472271)

出版年

2021

计算机应用研究

四川省电子计算机应用研究中心

计算机应用研究

CSTPCDCSCD北大核心

影响因子：0.93

ISSN：1001-3695

被引量2

参考文献量3

段落导航