首页|论蒙古语词素切分的实现

论蒙古语词素切分的实现

扫码查看
词素切分即视词根与附加成分为基本词素,自动识别词根的词性及意义、附加成分类型信息.基于词素的切分能有效处理歧义和未登录词,有效缓解数据稀疏问题,促进语言信息处理深层次发展.目前蒙古文信息处理还尚未进入词素切分层面.论文探讨了实现词素切分的理论和实践基础、面临的难题,认为:实现蒙古语的词素切分需要充分利用定性与定量,规则加统计的方法,先借助语言学的定性研究成果,建立信息处理用词根及附加成分词典,制订《信息处理用现代蒙古语切分规范》,然后以规范为指导,以电子词典为基础,建立词素切分理念的语料库,修改与验证规范及词典,进一步解决词根与附加成分的量化与切分问题,实现词素切分.

Tong Laga、通拉嘎、Zhao Xiaobing、赵小兵

展开 >

Quanzhou Normal University,Quanzhou 362000

Department of Minority Language and Literature,Minzu University of China,Beijing 100081

泉州师范学院图书馆,福建泉州362000

中央民族大学少数民族语言文学学院,北京100081

展开 >

信息处理 词素切分 词根 附加成分 语料库 蒙古语

中国中文信息学会

第十一届全国计算语言学学术会议

2011-08-20

洛阳

第十一届全国计算语言学学术会议论文集

77-82

2011