基于语义融合的英文自动短答案评分方法

吴晗¹

扫码查看

作者信息

1. 广西师范大学
折叠

摘要

近年来，由于信息技术的飞速发展，人工智能渐渐成为人们研究的主流方向。智能教学系统(Intelligent Tutoring Systems,ITSs)作为计算机辅助教学的一部分由于其便捷、智能等特点越来越受教学相关的从业人员的喜爱。对于传统的人工评分方法，一方面，需要耗费评分者极大的精力，给教师造成严重的工作负担；另一方面，还存在人为主观的因素影响评分质量，使得评分结果带有不公平性。渐渐地，越来越多的研究人员将对神经网络和深度学习的研究应用到各个方面。通过深度学习进行短答案评分，不仅可以有效地避免人为判卷时的主观影响，而且减少了教师的教学工作。自动短答案评分(Automatic Short Answer Grading,ASAG)是智能教学系统的关键组成部分。然而，ASAG的深度学习方法仍然存在以下两大挑战：（1）高精度评分要求评分者对答案文本有深刻的理解；（2）ASAG的语料库通常较小，不能为深度学习提供足够的训练数据。为解决上述问题，本文提出了如下两种基于深度学习的自动英文短答案评分方法：（1）提出一种基于多维嵌入的自动英文短答案评分方法，结合句法分析方法对文本语义进行深入理解。该方法以自然语言处理基本任务之一的文本匹配任务作为切入点对文本语义做深入理解，研究在不同的文本之间语义的关系。构建带有深层语义表示的方法抽取文本蕴涵的语义信息。先在Quora数据集上评估文本语义的理解程度，然后在扩充的Mohler数据集上验证带有语义理解的深度学习方法与不带有语义理解的深度学习方法之间的差异。（2）提出一种基于BERT(Bidirectional Encoder Representation from Transformers)的自动英文短答案评分方法，在保证文本的深入理解的同时解决在小语料上训练数据不足的问题。首先对于训练数据不足的问题，采用主流的预训练模型作为信息编码方法，为实现对短答案文本的深入理解，在BERT基础之上构建了一个由Bi-LSTM和胶囊(Capsule)网络组成的语义细化层，并提出符合短答案评分任务需求的triple-hot变种交叉熵损失函数取代初始的one-hot损失函数，在SemEval-2013数据集和Mohler数据集上验证模型效果。

关键词

短答案自动评分/文本匹配/胶囊网络/语义融合

引用本文复制引用

授予学位

硕士

学科专业

软件工程

导师

朱新华

学位年度

2022

学位授予单位

广西师范大学

语种

中文

中图分类号

段落导航