现代计算机2022,Vol.28Issue(23) :70-73,85.DOI:10.3969/j.issn.1007-1423.2022.23.012

融合MacBERT和Kenlm的中文纠错方法

Chinese Error Correction Method Integrating MacBERT and Kenlm

王梦贤 何春辉
现代计算机2022,Vol.28Issue(23) :70-73,85.DOI:10.3969/j.issn.1007-1423.2022.23.012

融合MacBERT和Kenlm的中文纠错方法

Chinese Error Correction Method Integrating MacBERT and Kenlm

王梦贤 1何春辉2
扫码查看

作者信息

  • 1. 湖南城市学院管理学院,益阳 413000
  • 2. 国防科技大学信息系统工程重点实验室,长沙 410073
  • 折叠

摘要

中文纠错属于自然语言处理的基础任务,考虑到现有方法纠错性能偏低,无法满足实际的纠错需求,提出了一种融合MacBERT和Kenlm的中文纠错方法.在公开数据集上的实验结果表明,该方法的精确率、召回率和F1值分别达到了78.2%、72.7%、75.3%.尤其是F1值比基线方法提升了3.6个百分点,充分证明了所提方法的有效性.

关键词

中文纠错/Kenlm/迁移学习/MacBERT

引用本文复制引用

基金项目

&&(XSP20YBC027)

出版年

2022
现代计算机
中大控股

现代计算机

影响因子:0.292
ISSN:1007-1423
参考文献量8
段落导航相关论文