光电子·激光2021,Vol.32Issue(5) :491-498.DOI:10.16136/j.joel.2021.05.0410

多机制合并注意力的多路径神经机器翻译方法

A multi-path neural machine translation method based on multi-mechanism attention

范洪博 郑棋
光电子·激光2021,Vol.32Issue(5) :491-498.DOI:10.16136/j.joel.2021.05.0410

多机制合并注意力的多路径神经机器翻译方法

A multi-path neural machine translation method based on multi-mechanism attention

范洪博 1郑棋1
扫码查看

作者信息

  • 1. 昆明理工大学信息工程与自动化学院,云南昆明650500
  • 折叠

摘要

注意力机制是目前神经机器翻译的主流技术,目前已提出了多种注意力生成机制,各机制生成的注意力各有优劣,但每种机制都不能充分利用全部已知信息,其结果和理论上的真实注意力具有一定差距,影响翻译质量.本文提出一种基于民主决策的合并注意力生成方法,将多种注意力生成机制所产生的注意力进行加权叠加与归一化后,所生成的值作为新的注意力,用于指导解码器的翻译过程.类似民主决策会比独断专行的决策获得更好的决策准确度,该机制可以获得相对更为准确的注意力,进而提升翻译质量.基于上述方法,本文在CNN、Transformer、Tree Transformer三个算法的基础上,生成合并注意力,提出MA-CTT算法,在开放德英语料(IWSLT14)上,MA-CTT获得了32.61的BLEU,翻译准确度明显高于各基础算法.

关键词

神经机器翻译/注意力/CNN/transformer/tree/transformer

引用本文复制引用

出版年

2021
光电子·激光
天津理工大学 中国光学学会

光电子·激光

CSCD北大核心
影响因子:1.437
ISSN:1005-0086
被引量3
参考文献量21
段落导航相关论文