面向片段抽取式机器阅读理解的注意力网络

扫码查看

原文链接

国家科技期刊平台
NETL
NSTL
万方数据
维普

中文摘要：目前机器阅读理解的注意力网络主要基于LSTM或GRU,由于RNNs的本质,训练和推理非常耗时.此外,这些模型使用粗粒度的注意机制来定位答案的边界.为了解决上述问题,论文提出了一个双重的简单递归单元(DSRU)和一个细粒度的指针网络,并且提出了一种新的机器阅读注意网络(FGAN),旨在回答给定的叙事段落的问题,该网络性能良好,且耗时较短.在Stanford Question Dataset(1.1)上展示了模型的有效性,该单一模型在开发集上获得了85.1的F1分.此外,在2.0上进行的辅助实验表明,该单一模型在开发集上取得了65.95的F1分,这个分数高于两个提出的基线,但略低于最佳基线.

外文标题：Attention Networks for Fragment Extractive Machine Reading Comprehension

作者：

赵加坤、戴梦瑶、刘江宁、邱超凡、赵子双

展开 >

作者单位：

西安交通大学软件学院西安 710049

关键词：

机器阅读理解神经网络注意力机制

出版年：

2022

DOI：

10.3969/j.issn.1672-9722.2022.02.024

计算机与数字工程

中国船舶重工集团公司第七0九研究所

计算机与数字工程

CSTPCD

影响因子：0.355

ISSN：1672-9722

年,卷(期)：2022.50(2)

被引量1
参考文献量21