基于句向量的多轮检索机器阅读理解模型研究

张恒杰¹

扫码查看

作者信息

1. 华中科技大学
折叠

摘要

随着信息化的发展，互联网已经累计了海量的文本数据。如何准确获取自己想要的信息一直是人们所关心的问题。以关键字匹配为基础的搜索引擎对自然语言提问没有完全的理解能力，无法理解用户检索问题的实质和关键内容。机器阅读理解是问答系统、语义搜索需要解决的核心问题，并逐渐成为最近的研究热点。本文在进行机器阅读理解相关研究时发现，现有模型无法利用与问题存在间接关系的文本信息。当文本较长、文本和问题较为复杂时，模型无法轻易跳过不相关文本。本文深入调研了国内外在机器阅读理解方面的研究，并通过几个经典的模型对现有模型的缺陷进行分析。在多轮推理方式的启发下，本文提出了多轮检索(Multi-turn Retrieval，MTR)模型。MTR模型会反复阅读文章，并使用基于句向量的检索算法在每轮阅读中检索出与问题相关的句子，然后利用注意力机制将检索得到的句子信息嵌入到问题向量中，最后利用包含文本信息的问题向量继续这一过程。检索结束时我们将得到一个与问题相关的句子集合，模型会利用这个句子集合来预测答案。本文提出的MTR模型在检索时同时考虑了问题和文本之间的直接关系和间接关系，并且MTR模型没有使用整个文章来预测答案而只是使用了检索得到的句子集合。本文提出的MTR模型可以解决更为复杂的问题。为了验证模型的效果，本文在HotpotQA和SQuAD-Open两个公开数据集上进行了实验。我们将MTR模型与其他学者的模型进行了对比。实验结果表明，在SQuAD-Open数据集上MTR模型在F1和EM两个指标上达到了最优，在HotpotQA数据集上MTR模型虽然在答案范围预测指标上弱于现有最好模型，但是在答案预测的可解释性指标上达到了最优。这表明了本文提出的模型可以较好的解决现有模型遇到的上述问题。为了进一步验证本文提出的检索方法的合理性和效果，我们还设置了两个补充实验和一个在抽样数据上的验证实验，实验结果也证实了本文的方法的有效性。

关键词

机器阅读/多轮检索/注意力机制/循环神经网络

引用本文复制引用

授予学位

硕士

学科专业

信息与通信工程

导师

王玉明

学位年度

2020

学位授予单位

华中科技大学

语种

中文

中图分类号

段落导航