中文分词和词性标注联合模型综述

扫码查看

原文链接

NETL
NSTL
万方数据
维普

中文摘要：中文分词和词性标注任务作为中文自然语言处理的初始步骤,已经得到广泛的研究.由于中文句子缺乏词边界,所以中文词性标注往往采用管道模式完成:首先对句子进行分词,然后使用分词阶段的结果进行词性标注.然而管道模式中,分词阶段的错误会传递到词性标注阶段,从而降低词性标注效果.近些年来,中文词性标注方面的研究集中在联合模型.联合模型同时完成句子的分词和词性标注任务,不但可以改善错误传递的问题,并且可以通过使用词性标注信息提高分词精度.联合模型分为基于字模型、基于词模型及混合模型.本文对联合模型的分类、训练算法及训练过程中的问题进行详细的阐述和讨论.

外文标题：The Review on the Joint Model of Chinese Word Segmentation and Part-of-speech Tagging

作者：

赵芳芳、蒋志鹏、关毅

展开 >

作者单位：

哈尔滨工业大学计算机科学与技术学院,哈尔滨150001

关键词：

中文分词中文词性标注联合模型

基金：

国家自然科学基金

项目编号：

60975077

出版年：

2014

智能计算机与应用

哈尔滨工业大学

智能计算机与应用

影响因子：0.357

ISSN：2095-2163

年,卷(期)：2014.4(3)

被引量1
参考文献量14