基于词向量的双语句子相似度研究

扫码查看

原文链接

NETL
NSTL
万方数据

中文摘要：双语句子对齐是自然语言处理中的一项基础性任务,该任务本身可以为统计机器翻译提供基础资源,同时,该任务所依赖的相似度计算技术也是传统统计机器翻译方法中的重要环节.以谷歌翻译为媒介,本文将中文-英文双语对齐语料转化为英文-英文对齐语料.在此基础上,本文尝试将词向量作为计算句子相似度的基础,验证词向量在双语对齐领域的作用.在限定了对齐句子上下范围的基础上,本文得到了82％准确率,初步实现了实验目的.本文结果表明,词向量可以作为双语相似度计算的基础,但对词向量本身更加细致的应用,以及应用更多的规则来提升其效果是实现词向量在双语对齐中作用的关键.

作者：

王闻慧

展开 >

作者单位：

471003 战略支援部队信息工程大学洛阳校区基础系河南洛阳

关键词：

双语句子对齐词向量谷歌翻译

出版年：

2019

数字化用户

ISSN：

年,卷(期)：2019.25(14)

参考文献量3