基于重解码的神经机器翻译方法研究

宗勤勤¹

扫码查看

作者信息

1. 江西师范大学
折叠

摘要

机器翻译（MachineTranslation，MT）是指使用机器（计算机）自动地将一种语言（源语言）转化为另一种自然语言（目标语言）的过程。从理论上讲，研究不同语言之间的翻译涉及计算机科学、语言学以及数学与逻辑学等若干学科和技术，是目前国际上最具挑战性的前沿研究课题之一，具有重要的研究意义。随着国际交流的日益频繁和我国一带一路战略的推进，机器翻译技术有效地缓解了不同地区和国家人民交流和沟通中的语言障碍，研究提高机器翻译系统输出译文质量的途径是机器翻译领域的热点之一。近年来，深度学习技术在机器翻译领域已经取得了很大的进展，在许多语言对上已经超过了传统的机器翻译方法。基于编码器-解码器的模型被广泛应用于神经机器翻译任务，基于Transformer的序列转换模型是当前性能最优的机器翻译模型之一。该模型在生成机器译文时，通常从左到右逐个生成目标词，这使得当前位置词的生成不能利用译文中该词之后未生成词的信息，导致机器译文解码不充分从而降低译文质量。为了缓解上述问题，我们提出了基于重解码的神经机器翻译模型，该模型将已生成的机器译文作为目标语言近似上下文环境，对译文中每个词依次进行重解码，重解码时Transformer解码器中遮挡多头注意力仅遮挡已生成译文中的当前位置词，因此，重生成的每个词都能充分利用目标语言的上下文信息。在多个WMT机器翻译评测任务测试集上的实验结果表明：使用基于重解码的神经机器翻译方法显著提高了机器译文质量。本文在WMT2019、WMT2018和WMT2017新闻领域机器翻译评测任务数据集上对基于重解码的神经机器翻译方法进行验证和分析。此外，针对不同的遮挡方式和解码器层数进行了消融实验，以验证TransRedecoder模型提高重解码译文质量的有效性。实验结果表明，基于重解码的神经机器翻译方法使得在生成重解码译文过程中，每一时刻生成的目标端词不仅仅依赖于该词的上文信息，还取决于该词的下文，缓解因下文缺失而导致的欠翻译问题，从而显著提高目标语言机器译文质量。

关键词

神经机器翻译/编码器-解码器模型/重解码/遮挡注意力矩阵

引用本文复制引用

授予学位

硕士

学科专业

计算机科学与技术

导师

李茂西

学位年度

2021

学位授予单位

江西师范大学

语种

中文

中图分类号

段落导航