计算机技术与发展2020,Vol.30Issue(11) :69-73.DOI:10.3969/j.issn.1673-629X.2020.11.013

基于深度学习的中文语法错误诊断方法研究

Research on Chinese Grammar Error Diagnosis Method Based on Deep Learning

王辉 潘俊辉 王浩畅 张强 张岩 Marius.Petrescu
计算机技术与发展2020,Vol.30Issue(11) :69-73.DOI:10.3969/j.issn.1673-629X.2020.11.013

基于深度学习的中文语法错误诊断方法研究

Research on Chinese Grammar Error Diagnosis Method Based on Deep Learning

王辉 1潘俊辉 1王浩畅 1张强 1张岩 1Marius.Petrescu2
扫码查看

作者信息

  • 1. 东北石油大学 计算机与信息技术学院,黑龙江 大庆 163318
  • 2. 普罗莱斯蒂石油天然气大学,罗马尼亚 什蒂市 100680
  • 折叠

摘要

随着中国国际影响力的日益提高和汉语国际地位的提升,学习和使用汉语的国际学者越来越多.中文文本校对技术有助于各个领域处理所涉及到的文本错误,其中中文语法错误诊断是中文计算机辅助学习的研究热点之一.鉴于此,根据中文语法错误诊断的特点,通过分析现有中文语法错误诊断方法存在的问题,提出一种基于注意机制的双向长短期记忆网络(BI-LASM-ATT)与条件随机场(CRF)相结合的模型应用于中文语法错误诊断研究.该模型采用jieba分词技术对数据进行分词和词性标注等预处理工作,利用Skip-gram模型得到词向量表示,作为BI-LSTM-ATT模型的词嵌入层,获取到两个方向上的长距离信息提供给CRF模型进行序列标注.在NLPCC2018的TASK2提供的数据集上的实验结果表明,该模型对比传统语法错误诊断模型,在中文语法错误诊断的Accuracy、精确率、召回率和F_meature方面均有明显提高.

关键词

深度学习/条件随机场/长短期记忆网络/注意机制/语法错误诊断

引用本文复制引用

基金项目

国家自然科学基金(61402099)

国家自然科学基金(61702093)

黑龙江省自然科学基金(2018003)

东北石油大学青年科学基金(2018QNL-8)

东北石油大学青年科学基金(2018QNL-49)

出版年

2020
计算机技术与发展
陕西省计算机学会

计算机技术与发展

CSTPCD
影响因子:0.621
ISSN:1673-629X
被引量3
参考文献量3
段落导航相关论文