首页|基于统计的蒙汉机器翻译中词对齐方法研究

基于统计的蒙汉机器翻译中词对齐方法研究

Research on Word Alignment in Mongolian — Chinese Statistical Machine Translation

扫码查看
蒙古语属于小语种,蒙古语到汉语机器翻译相关研究进展缓慢.所以,实现高质量的蒙汉机器翻译对我国少数民族地区信息化发展有着重要意义.其中,词语对齐对机器翻译质量起着至关重要的作用.该文提出了一种基于蒙古语切分的词干词缀为基本单位的蒙汉机器翻译词对齐方法.该方法利用词干词缀表和逆向最大匹配算法来实现蒙古语句子词干词缀的切分.实验结果表明对蒙古语进行词干词缀的切分能够显著提高对数线性词对齐模型的对齐质量.
High-quality Mongolian to Chinese machine translation is of great significance to the development of IT in minority areas .To deal with the word alignment ,which is a key issue in SMT ,this paper proposes a Mongolian seg-mentation based on stems and affixes .To achieve this kind of basic unit of Mongolian Chinese word alignment ,we use stems and affixes table and reverse maximum matching algorithm .The experiment results indicate that the pro-posed method can significantly improve the alignment quality .

word alignmentIBM modelaffix and stem segmentlog linear model

苏依拉、赵亚平、牛向华

展开 >

内蒙古工业大学信息工程学院,内蒙古呼和浩特010080

词对齐 IBM模型 词干词缀切分 对数线性模型

国家自然科学基金国家自然科学基金内蒙古自治区自然科学基金内蒙古自治区民族事务委员会基金

61363052615022552016MS0605MW-2017-MGYWXXH-03

2018

中文信息学报
中国中文信息学会,中国科学院软件研究所

中文信息学报

CSTPCDCSCDCHSSCD北大核心
影响因子:0.8
ISSN:1003-0077
年,卷(期):2018.32(6)
  • 2
  • 8