现代计算机(普及版)2015,Issue(5) :7-10.DOI:10.3969/j.issn.1007-1423.2015.14.002

基于PCFG模型的哈萨克语句法分析

Syntactic AnaIysis of Kazakh Language Based on PCFG ModeI

尚文清 古丽拉·阿东别克 牛娜 于智娟
现代计算机(普及版)2015,Issue(5) :7-10.DOI:10.3969/j.issn.1007-1423.2015.14.002

基于PCFG模型的哈萨克语句法分析

Syntactic AnaIysis of Kazakh Language Based on PCFG ModeI

尚文清 1古丽拉·阿东别克 1牛娜 1于智娟1
扫码查看

作者信息

  • 1. 新疆大学信息科学与工程学院,乌鲁木齐 830046; 国家语言资源监测与研究中心少数民族语言中心哈萨克和柯尔克孜语言基地,乌鲁木齐 830046
  • 折叠

摘要

为了实现哈萨克语的句法分析,研究概率上下无关文法,结合哈萨克语自身的语法特征得到哈萨克语的概率上下无关文法,获取哈萨克语PCFG参数,结合自底向下的Viterbi算法进行句法分析的歧义消除,进而实现一种有自学习能力的哈萨克语句法分析器,哈萨克语句子分析达到不错的效果。实验结果显示,PCFG模型可以适用于到哈萨克语的句法分析研究。

Abstract

Introduces the work of Kazakh language in language processing, does the technology research on the construction of corpus annotation of syntax, analyzes the method to study the Kazakh syntax, and combined with the existing parsing model, it can learn that Kazakh proba-bilistic context free grammars from the annoted syntactic corpus, and then puts forward a self-learning Kazakh syntax parser. Experimen-tal results show that it perform well.

关键词

概率上下无关文法/哈萨克语/句法分析/句法树/Viterbi算法

Key words

Probabilistic Context Free Grammars/Kazakh/Syntactic Parser/Syntactic Tree/Viterbi Algorithm

引用本文复制引用

基金项目

现代哈萨克语短语识别及其语块库构建技术研究(61063025)

现代哈萨克语句法分析与树库构建关键技术研究(61063062)

出版年

2015
现代计算机(普及版)
中山大学

现代计算机(普及版)

影响因子:0.202
ISSN:1007-1423
被引量4
参考文献量4
段落导航相关论文