首页|基于融合注意力机制的图像标题生成

基于融合注意力机制的图像标题生成

扫码查看
图像标题生成利用机器自动产生描述图像的句子,属于计算机视觉与自然语言处理的交叉领域.传统基于注意力机制的算法侧重特征图不同区域,忽略特征图通道,易造成注意偏差.该模型通过当前嵌入单词与隐藏层状态的耦合度来赋予特征图不同通道相应权重,并将其与传统方法结合为融合注意力机制,准确定位注意位置.实验结果均在指定的评估方法上有一定的提升,表明该模型可以生成更加流利准确的自然语句.
Image caption generation based on fusion attention mechanism

侯一雯、田玉玲

展开 >

太原理工大学 信息与计算机学院,太原030000

图像标题生成 注意偏差 通道 耦合度 融合注意力

国家自然科学基金

61472271

2021

计算机应用研究
四川省电子计算机应用研究中心

计算机应用研究

CSTPCDCSCD北大核心
影响因子:0.93
ISSN:1001-3695
年,卷(期):2021.38(7)
  • 2
  • 3