数字化用户2019,Vol.25Issue(14) :238-240.

基于词向量的双语句子相似度研究

王闻慧
数字化用户2019,Vol.25Issue(14) :238-240.

基于词向量的双语句子相似度研究

王闻慧1
扫码查看

作者信息

  • 1. 471003 战略支援部队信息工程大学洛阳校区基础系 河南 洛阳
  • 折叠

摘要

双语句子对齐是自然语言处理中的一项基础性任务,该任务本身可以为统计机器翻译提供基础资源,同时,该任务所依赖的相似度计算技术也是传统统计机器翻译方法中的重要环节.以谷歌翻译为媒介,本文将中文-英文双语对齐语料转化为英文-英文对齐语料.在此基础上,本文尝试将词向量作为计算句子相似度的基础,验证词向量在双语对齐领域的作用.在限定了对齐句子上下范围的基础上,本文得到了82%准确率,初步实现了实验目的.本文结果表明,词向量可以作为双语相似度计算的基础,但对词向量本身更加细致的应用,以及应用更多的规则来提升其效果是实现词向量在双语对齐中作用的关键.

关键词

双语句子对齐/词向量/谷歌翻译

引用本文复制引用

出版年

2019
数字化用户

数字化用户

ISSN:
参考文献量3
段落导航相关论文