计算机工程2024,Vol.50Issue(8) :363-371.DOI:10.19678/j.issn.1000-3428.0068333

基于主题感知和语义增强的作文自动评分方法

Automatic Essay Scoring Method Based on Topic Perception and Semantic Enhancement

陈宇航 杨勇 先木斯亚·买买提明 帕力旦·吐尔逊 樊小超 任鸽 刁宇峰
计算机工程2024,Vol.50Issue(8) :363-371.DOI:10.19678/j.issn.1000-3428.0068333

基于主题感知和语义增强的作文自动评分方法

Automatic Essay Scoring Method Based on Topic Perception and Semantic Enhancement

陈宇航 1杨勇 1先木斯亚·买买提明 2帕力旦·吐尔逊 1樊小超 3任鸽 1刁宇峰4
扫码查看

作者信息

  • 1. 新疆师范大学计算机科学技术学院,新疆乌鲁木齐 830054
  • 2. 和田师范专科学校数学与信息学院,新疆和田 848000
  • 3. 新疆师范大学计算机科学技术学院,新疆乌鲁木齐 830054;和田师范专科学校数学与信息学院,新疆和田 848000
  • 4. 内蒙古民族大学计算机科学与技术学院,内蒙古通辽 028000
  • 折叠

摘要

作文自动评分(AES)是教育领域中应用自然语言处理(NLP)技术的重要研究方向之一,其旨在提高评分效率,增强评价的客观性和可靠性.针对主题相关性缺失和长文本信息丢失问题以及预训练语言模型BERT不同层次能够提取不同维度特征的特点,提出一种基于主题感知和语义增强的作文自动评分模型.该模型采用多头注意力机制提取作文的浅层语义特征并感知作文主题特征,同时利用BERT的中间层句法特征和深层语义特征增强对作文语义的理解.在此基础上,融合不同维度的特征并用于作文自动评分.实验结果表明,该模型在公共数据集ASAP的8个子集上均表现出了显著的性能优势,相比于通义千问等基线模型,其能够有效提升作文自动评分性能,平均二次加权的卡帕值(QWK)达到80.25%.

Abstract

Automatic Essay Scoring(AES)is an important research topic for the application of Natural Language Processing(NLP)technology in the field of education.AES aims to improve scoring efficiency and enhance the objectivity and reliability of evaluations.This study proposes a topic perception and semantic enhancement approach for AES,addressing the issues of missing thematic relevance and loss of information in long texts,as well as leveraging the different levels of feature extraction capability in the pre-training language model,Bidirectional Encoder Representations from Transformers(BERT).This approach utilizes a multi-head attention mechanism to extract shallow semantic features of an essay and perceive its thematic characteristics.Additionally,it leverages the mid-level syntactic and deep semantic features of BERT to enhance the understanding of the semantics of the essay.Finally,the fused features from different dimensions are used for the AES.Experimental results indicate that the proposed model exhibits significant performance advantages for eight subsets of the ASAP public dataset.The proposed model effectively improves the performance of AES compared to that of baseline models,such as Qwen-7B;its average Quadratic Weighted Kappa(QWK)is 80.25%.

关键词

作文自动评分/语义增强/主题感知/特征融合/预训练语言模型

Key words

Automatic Essay Scoring(AES)/semantic enhancement/topic perception/feature fusion/pre-training language model

引用本文复制引用

基金项目

新疆维吾尔自治区自然科学基金(2021D01B72)

国家自然科学基金(62066044)

国家自然科学基金(62167008)

国家自然科学基金(62006130)

出版年

2024
计算机工程
华东计算技术研究所 上海市计算机学会

计算机工程

CSTPCD北大核心
影响因子:0.581
ISSN:1000-3428
被引量1
参考文献量5
段落导航相关论文