首页|中文网络非正规语言处理的方法与实践

中文网络非正规语言处理的方法与实践

夏云庆 黄锦辉

中文网络非正规语言处理的方法与实践

夏云庆 1黄锦辉1
扫码查看

作者信息

  • 1. 香港中文大学系统工程与工程管理系,香港
  • 折叠

摘要

非正规语言广泛应用于以网络为媒介的通信中,如聊天室,BBS,电子邮件和短信等.我们称在这些环境中使用的特殊语言表达为网络非正规语言(NIL)表达,例如中文ICQ中"偶"等同于"我".NIL表达处理需要非常规知识和技术,而目前面向正规语言的自然语言处理技术在处理NIL文本时效果并不理想.这一问题导致了NIL处理研究,即通过研制NIL处理系统,提高自然语言处理技术对NIL的适应性.研制开发了NILER系统,实现了模式匹配和支持向量机的NIL表达识别方法.实验结果表明,对已标注NIL表达的识别,模式匹配方法的准确率较高(91.5%),支持向量机方法的F-1指数较高(87.1%).

关键词

网络非正规语言/信息抽取/语言处理/自然语言

引用本文复制引用

主办单位

中国中文信息学会/中国计算机学会/中国人工智能学会/北京市语言学会

会议名称

全国第八届计算语言学联合学术会议

会议时间

2005-08-27

会议地点

南京

会议母体文献

自然语言理解与大规模内容计算

页码

566-572

出版时间

2005
段落导航相关论文