计算机技术与发展2023,Vol.33Issue(7) :160-166.DOI:10.3969/j.issn.1673-629X.2023.07.024

融合动态卷积注意力的机器阅读理解研究

Study on Machine Reading Comprehension Hybriding Dynamic Convolution Attention

吴春燕 李理 黄鹏程 刘知贵 张小乾
计算机技术与发展2023,Vol.33Issue(7) :160-166.DOI:10.3969/j.issn.1673-629X.2023.07.024

融合动态卷积注意力的机器阅读理解研究

Study on Machine Reading Comprehension Hybriding Dynamic Convolution Attention

吴春燕 1李理 1黄鹏程 1刘知贵 2张小乾3
扫码查看

作者信息

  • 1. 西南科技大学 计算机科学与技术学院,四川 绵阳 621000
  • 2. 西南科技大学 计算机科学与技术学院,四川 绵阳 621000;西南科技大学 信息工程学院,四川 绵阳 621000
  • 3. 西南科技大学 信息工程学院,四川 绵阳 621000
  • 折叠

摘要

针对机器阅读理解在采用长短期记忆神经网络和注意力机制处理文本序列信息时,存在特征信息提取不足和预测结果准确性不高的问题,提出了一种融合动态卷积注意力的片段抽取型机器阅读理解模型.该模型考虑到LSTM的当前输入和之前的状态相互独立,可能会导致上下文信息丢失,采用Mogrifier作为编码器,让当前输入与前一个状态充分交互多次,增强上下文和问题中的显著结构特征并减弱其次要特征;其次,由于静态卷积的卷积核相同,只能提取固定长度文本的特征,这可能对机器更好的理解文本产生阻碍,通过引入动态卷积,采用多个不同卷积核的一维卷积来捕获上下文和问题的局部结构,弥补注意力机制只有全局捕获能力的缺点.在SQuAD数据集上的实验结果表明,与其他模型相比,该方法有效提升了模型在特征信息提取和答案预测方面的能力.

关键词

机器阅读理解/片段抽取/答案预测/长短期记忆神经网络/动态卷积

Key words

machine reading comprehension/span-extracting/answer prediction/long short-term memory/dynamic convolution

引用本文复制引用

基金项目

国家自然科学基金(62102331)

国家自然科学基金(62176125)

国家自然科学基金(61772272)

出版年

2023
计算机技术与发展
陕西省计算机学会

计算机技术与发展

CSTPCD
影响因子:0.621
ISSN:1673-629X
参考文献量3
段落导航相关论文