基于知识及流利度提升的中文语法纠错模型

扫码查看

原文链接

NETL
NSTL
万方数据

中文摘要：语法错误纠正(grammatical error correction,GEC)旨在将包含语法错误的句子纠正为正确的句子.目前语法错误纠正研究主要基于Transformer模型,但由于模型参数规模大,中文GEC任务语料不足,Transformer无法得到充分训练来学习文本中足够的语义信息.提出了基于知识及流利度提升策略的中文GEC模型,将MacBERT预训练模型作为外部知识来源,并利用流利度提升策略缓解GEC模型单轮推理纠错不完全的局限.为了验证所提出的GEC模型的有效性,在NLPCC 2018 中文GEC共享任务数据集上进行了大量实验,其性能优于NLPCC 2018 GEC共享任务中开发的最佳模型.

作者：

王岩、梁椰玲

展开 >

作者单位：

郑州科技学院信息工程学院河南郑州 450064

关键词：

中文语法纠错 Transformer模型知识增强学习流利度提升策略预训练语言模型

出版年：

2024

DOI：

10.3969/j.issn.1672-9528.2024.05.023

信息技术与信息化

山东电子学会

信息技术与信息化

影响因子：0.29

ISSN：1672-9528

年,卷(期)：2024.(5)