摘要
随着信息化时代的发展,知识库中积累了海量知识,如何高效地获取其中的结构化知识具有重要研究意义。知识库问答作为一种能通过自然语言从知识库中获取知识的应用,获得了人们的广泛关注,并广泛应用于搜索引擎、电子商务、智能问答和辅助教育等领域。因此,研究高性能的知识库问答技术有助于推动科技进步、促进经济发展、改善人民生活水平。 知识库问答的难点在于如何准确地理解问题的语义、如何有效地挖掘知识库中的知识来实现答案推理。目前主流的知识库问答方法可分为基于语义解析和基于搜索排序两大类,虽然这方面的研究近年来已经取得了巨大的进展,但是如何有效地捕获知识库中的结构信息以提升知识库问答的效果仍未得到充分的解决。因此,本文从问题解析方面研究结构信息在基于语义解析的方法中的应用,从语义表示和答案推理方面研究结构信息在基于搜索排序的方法中的应用。在问题解析方面,现有方法直接根据问题的上下文语义信息来构建逻辑表达式,解析过程未考虑逻辑表达式的结构信息,导致模型难以构建准确的逻辑表达式,从而影响知识库问答的效果。在语义表示方面,现有方法从知识库中抽取文本信息作为候选答案的特征,不仅引入了噪声,还缺少对候选答案特征的结构化建模,导致模型对知识库的结构挖掘不够深入,造成问题与候选答案之间的语义匹配困难。在答案推理方面,现有方法单独评估每个候选答案与问题的匹配程度,忽略了各个候选答案之间的关联关系,缺乏对所有候选答案的全局结构建模,从而影响答案推理效果。针对现有方法存在的挑战与不足,本文从提升模型的问题解析能力、语义表示能力和答案推理能力三个方面出发,研究基于图结构的知识库问答,并取得如下研究成果: 1.基于结构级匹配的问题自动解析方法 基于语义解析的知识库问答方法从知识库中选取与问题相关的若干个候选逻辑表达式,通过问题与每个候选逻辑表达式的语义匹配程度来挑选最终的逻辑表达式,实现语义解析。然而,现有方法在进行语义匹配时忽略了逻辑表达式的结构信息,因此,本文提出一种结构级语义匹配方法。该方法采用图卷积网络分别将问题与候选逻辑表达式建模为图结构,通过两种图结构之间的语义匹配来弥补词级匹配中语义信息不完整的不足。然后采用交互注意力机制来挖掘问题与知识库中的深层语义信息,从而提升模型对问题的语义解析能力。本文在多个基准数据集上开展了实验,结果表明结构级语义匹配方法能够有效捕获问题的深层语义信息,从而提升知识库问答模型解析问题的能力。 2.基于图感知注意力的表示学习方法 基于搜索排序的知识库问答方法从知识库中抽取与每个候选答案相关的文本信息(如答案类型、关系路径、答案上下文等)作为候选答案的特征,不仅引入了大量与问题无关的信息,而且直接使用文本信息会忽略候选答案的各种信息之间的关联关系。为此,本文提出一种基于答案图感知的交互注意力网络。该方法将候选答案特征建模为答案图,通过门控图神经网络过滤掉与问题无关的特征。然后利用答案图来引导模型深度挖掘问题与候选答案之间的语义关系,从而提升模型对问题与候选答案之间语义匹配的准确率。实验结果表明,基于图感知注意力的表示学习方法能准确捕获候选答案的语义信息,深度挖掘问题与候选答案之间的语义关系,有效提升知识库问答模型的语义表示能力。 3.基于图卷积网络的全局答案推理方法 基于搜索排序的知识库问答方法在进行答案推理时单独地对每个候选答案与问题进行语义匹配,推理范围仅局限于每个候选答案的内部,导致知识库问答模型难以实现对复杂问题的答案推理,而且当多个候选答案与问题语义均相似时,难以从中推理出正确答案。因此,本文提出一种全局推理模式,将所有候选答案及其关联关系建模为图结构,并将问题的语义信息与知识库的语义信息融入到图节点中,采用图卷积网络在节点间传递这些语义信息,以实现面向所有候选答案的全局推理。在基准数据集上的实验结果表明,全局推理模式能有效提升知识库问答模型的答案推理能力。