计算机应用研究2021,Vol.38Issue(2) :386-390.DOI:10.19734/j.issn.1001-3695.2019.12.0670

基于语言模型的中文话头自足句识别方法

NT clause recognition method based on language model

张禹尧 蒋玉茹 毛腾 张仰森
计算机应用研究2021,Vol.38Issue(2) :386-390.DOI:10.19734/j.issn.1001-3695.2019.12.0670

基于语言模型的中文话头自足句识别方法

NT clause recognition method based on language model

张禹尧 1蒋玉茹 1毛腾 1张仰森1
扫码查看

作者信息

  • 1. 北京信息科技大学 智能信息处理研究所,北京 100101
  • 折叠

摘要

根据话头自足句理论进行标点句的话头自足句识别任务,探究语言模型在该任务中的应用效果,进一步将该任务划分为单个标点句的话头自足句识别和标点句序列的话头自足句识别.在单个标点句的话头自足句识别任务中,对该任务在形式上进行了完整的定义,将其形式化为机器阅读理解任务.从结果来看,在《围城》语料上取得了83.46%的准确率,在"鱼类百科"语料上的准确率达到91.21%.在标点句序列的话头自足句识别任务中,利用单个标点句的话头自足句识别任务中训练好的模型,以流水线的方式进行标点句序列的话头自足句识别,在"鱼类百科"语料上的准确率达到82.03%.实验结果表明,提出的方法能够有效地提高中文话头自足句识别的准确率.

关键词

话头自足句/语言模型/标点句/机器阅读理解

引用本文复制引用

基金项目

国家自然科学基金资助项目(61602044)

国家自然科学基金资助项目(61772081)

促进高校内涵发展—研究生科技创新项目(5121911044)

出版年

2021
计算机应用研究
四川省电子计算机应用研究中心

计算机应用研究

CSTPCDCSCD北大核心
影响因子:0.93
ISSN:1001-3695
参考文献量6
段落导航相关论文