摘要
非正规语言广泛应用于以网络为媒介的通信中,如聊天室,BBS,电子邮件和短信等.我们称在这些环境中使用的特殊语言表达为网络非正规语言(NIL)表达,例如中文ICQ中"偶"等同于"我".NIL表达处理需要非常规知识和技术,而目前面向正规语言的自然语言处理技术在处理NIL文本时效果并不理想.这一问题导致了NIL处理研究,即通过研制NIL处理系统,提高自然语言处理技术对NIL的适应性.研制开发了NILER系统,实现了模式匹配和支持向量机的NIL表达识别方法.实验结果表明,对已标注NIL表达的识别,模式匹配方法的准确率较高(91.5%),支持向量机方法的F-1指数较高(87.1%).