摘要
机器译文自动评价是指使用计算机技术对机器翻译系统输出译文的质量进行自动评价,它是机器翻译领域的一项重要研究任务,对机器翻译系统的优化起着指导作用。目前机器译文自动评价领域的研究主流为基于神经网络的机器译文自动评价。 最新的神经机器译文自动评价方法使用预训练语境词向量提取深层语义特征,并将它们直接拼接输入多层神经网络预测译文质量,其中直接拼接操作容易导致特征间缺乏深入融合;而逐层抽象进行预测时容易丢失细粒度准确匹配信息。针对以上问题,本文提出基于多元信息融合的神经机器译文自动评价方法,该译文自动评价方法引入中期信息融合方法和后期信息融合方法,使用拥抱融合对不同特征进行交互中期融合,基于细粒度准确匹配的句移距离和句级余弦相似度进行后期融合,实现细粒度准确匹配信息的引入和不同语义特征的高效融合。 另一方面,当前的机器译文自动评价主要通过大规模预训练语言模型直接提取机器译文和参考译文的语义表征后计算表征相似度,然而当前的预训练语言模型可能会将语义相近的句子映射到相距较远的稠密向量空间中。针对该问题,本文提出引入孪生相似特征的神经机器译文自动评价方法,该方法使用孪生网络结构对预训练语言模型进行微调,使其能够将语义相似的句子映射到相近的稠密向量空间中,从而更适用于机器译文自动评价领域。然后使用微调完成的孪生预训练语言模型提取语义相似特征,并将该特征引入神经机器译文自动评价方法中,以提升评价模型性能。 为了验证所提方法的有效性,在WMT’21MetricsTask基准数据集上进行实验,实验结果表明,本文所提方法能有效提高其与人工评价的相关性,达到与参加评测最优系统的可比性能。