信息技术与信息化2024,Issue(5) :107-110.DOI:10.3969/j.issn.1672-9528.2024.05.023

基于知识及流利度提升的中文语法纠错模型

王岩 梁椰玲
信息技术与信息化2024,Issue(5) :107-110.DOI:10.3969/j.issn.1672-9528.2024.05.023

基于知识及流利度提升的中文语法纠错模型

王岩 1梁椰玲1
扫码查看

作者信息

  • 1. 郑州科技学院信息工程学院 河南郑州 450064
  • 折叠

摘要

语法错误纠正(grammatical error correction,GEC)旨在将包含语法错误的句子纠正为正确的句子.目前语法错误纠正研究主要基于Transformer模型,但由于模型参数规模大,中文GEC任务语料不足,Transformer无法得到充分训练来学习文本中足够的语义信息.提出了基于知识及流利度提升策略的中文GEC模型,将MacBERT预训练模型作为外部知识来源,并利用流利度提升策略缓解GEC模型单轮推理纠错不完全的局限.为了验证所提出的GEC模型的有效性,在NLPCC 2018 中文GEC共享任务数据集上进行了大量实验,其性能优于NLPCC 2018 GEC共享任务中开发的最佳模型.

关键词

中文语法纠错/Transformer模型/知识增强学习/流利度提升策略/预训练语言模型

引用本文复制引用

出版年

2024
信息技术与信息化
山东电子学会

信息技术与信息化

影响因子:0.29
ISSN:1672-9528
段落导航相关论文