首页|面向片段抽取式机器阅读理解的注意力网络

面向片段抽取式机器阅读理解的注意力网络

扫码查看
目前机器阅读理解的注意力网络主要基于LSTM或GRU,由于RNNs的本质,训练和推理非常耗时.此外,这些模型使用粗粒度的注意机制来定位答案的边界.为了解决上述问题,论文提出了一个双重的简单递归单元(DSRU)和一个细粒度的指针网络,并且提出了一种新的机器阅读注意网络(FGAN),旨在回答给定的叙事段落的问题,该网络性能良好,且耗时较短.在Stanford Question Dataset(1.1)上展示了模型的有效性,该单一模型在开发集上获得了85.1的F1分.此外,在2.0上进行的辅助实验表明,该单一模型在开发集上取得了65.95的F1分,这个分数高于两个提出的基线,但略低于最佳基线.
Attention Networks for Fragment Extractive Machine Reading Comprehension

赵加坤、戴梦瑶、刘江宁、邱超凡、赵子双

展开 >

西安交通大学软件学院 西安 710049

机器阅读理解 神经网络 注意力机制

2022

计算机与数字工程
中国船舶重工集团公司第七0九研究所

计算机与数字工程

CSTPCD
影响因子:0.355
ISSN:1672-9722
年,卷(期):2022.50(2)
  • 1
  • 21