句子级机器翻译质量自动评估方法研究

邓涵铖¹

扫码查看

作者信息

1. 天津大学
折叠

摘要

机器翻译技术在全球化中扮演着十分重要的角色。随着全球化推进，机器翻译技术也在不断地进步，尤其是近些年来神经机器翻译技术的出现，将机器译文质量提升到了新的高度。尽管如今机器翻译技术达到了较高水平，但不少机器译文仍存在着错译、漏译、过译等问题。因此，机器翻译系统用户对实时掌握机器译文质量存在着较大需求。机器翻译质量自动评估（又称机器翻译译文质量估计，Machine Translation Quality Estimation，QE）是指在不需要人工参考译文的条件下，估计机器翻译系统产生的译文的质量，对机器翻译研究和应用具有很重要的价值。现有的机器翻译质量估计方法可分为三类，分别为：基于特征工程和机器学习的QE方法、基于深度学习的QE方法、融入预训练模型的QE方法。传统的基于特征工程和机器学习的QE方法严重依赖人工设计特征及语言学资源与分析，效果欠佳且缺乏通用性。基于深度学习的QE方法的出现在无需依赖人工设计特征及语言学资源的同时大大提升了QE模型效果。融入预训练模型的QE方法较前两类方法有了效果上的进一步提升，但该类方法对数据及硬件要求高，且并未脱离预测器-估计器框架。这些基于预测器-估计器框架存在着两个主要问题：1）预测器训练阶段与估计器训练两阶段分别使用不同类型数据进行训练，且两类数据存在着巨大数据量差异，导致模型缺少鲁棒性；2）源语言信息需要经过多次处理才能到达估计器，源语言信息是否参与（或参与多少）译文质量估计任务无法判断。针对上述两个问题，本文开展了以下工作：（1）针对问题1），本文从提升模型鲁棒性出发，在保留原有预测器-估计器架构的基础上（原有预测器作为主预测器），在预测器部分增加了混合预测器模型。使用伪噪声数据构造的方法针对平行语料构造带噪声的翻译，并使用带噪声的翻译对混合预测器进行训练，同时使用不带噪声的标准翻译对主预测器进行训练,并加入鲁棒性正则模块使主预测器与混合预测器能够正确区分标准翻译与带噪声的翻译，减小因带噪训练数据不足对预测器无法区分译文是否带噪的影响，突破预测器-估计器框架预测器训练阶段与估计器训练阶段数据量差异巨大而导致的模型鲁棒性不足的问题。（2）针对问题2），本文从增加源语言信息在估计器中的参与度出发，尝试了添加源语言正则模块的方法，将源语言信息直接输入源语言正则模块，并对源语言句子和带噪声的目标语言句子进行语义相似度建模，使估计器模型获得更多源语言信息，加强其对译文质量的评估能力。本文将以上两个工作整合为基于鲁棒性正则与源语言正则的QE方法，在WMT17-20英-德QE任务数据集上进行了实验。实验结果验证了本文方法对于解决预测器-估计器框架当前存在的上述两个问题的有效性。此外，为更好展现机器翻译质量估计技术的实用性及本文方法的效果，本文搭建了在线译文质量估计系统，使机器翻译系统能够自动过滤质量较差译文，帮助机器翻译系统用户实时了解译文质量。

关键词

机器翻译质量/自动评估/自然语言处理/深度学习

引用本文复制引用

授予学位

硕士

学科专业

计算机技术

导师

熊德意/郝杰

学位年度

2021

学位授予单位

天津大学

语种

中文

中图分类号

段落导航