首页|知识库问答中复杂问题的结构化查询生成方法研究

知识库问答中复杂问题的结构化查询生成方法研究

赵满

知识库问答中复杂问题的结构化查询生成方法研究

赵满1
扫码查看

作者信息

  • 1. 东南大学
  • 折叠

摘要

面向知识库的问答是信息检索的一种高级形式,具有非常重要的研究价值和应用前景。针对用户提出的自然语言问题,经过分析处理后,从知识库中查询或者推断出问题的答案。语义解析的方法就是目前广泛研究的一个方向,将自然语言问题转化成与之相对应的知识库结构化查询语句,最终在知识库中查询获得答案。 本文主要针对于复杂问句的知识库问答任务,结合复杂问句多实体、多关系、多约束的特点,通过语义解析的方法将复杂问句处理分析并提取出语义要素,进而转化成知识库能够理解的结构化查询语句,实现知识库问答。整体的语义解析流程包含四个阶段:实体链接,关系检测,约束检测,结构化查询生成。其中,前三个阶段从问句中提取出的语义要素(实体,关系,约束)作为第四个阶段结构化查询生成的支撑。本文在利用现有工具获得实体链接结果的基础上,提出了一种多注意力机制下的复杂句多关系检测方法,提出了复杂问句中多种约束的检测方法,提出了基于SPARQL-Tree作为中间状态的复杂问句结构化查询生成方法。本文的主要贡献如下: (1)提出了复杂问句的语义要素检测框架。提出了一种多注意力机制下的复杂句多关系检测方法。根据问句中不同的关系数量,采取不同数量的注意力机制下的问句和候选关系的编码相似度比较,从而得到问句中的多个关系。提出了复杂问句中多种约束的检测方法。针对于复杂句中每一种常见约束,包括查询意图、排序、过滤等,采取不同的约束识别方法完成约束检测。 (2)针对结构化查询生成步骤,提出了基于SPARQL-Tree作为中间状态的复杂问句查询构建方法。为了弥补复杂问句和结构化查询之间的巨大语义鸿沟,本文提出SPARQL-Tree作为中间状态,将结构化查询语句的生成看作一个树(SPARQL-Tree)的生成过程。利用SPARQL自身的上下文无关文法,构建出SPARQL-Tree由粗到细、自顶向下的双层解码生成过程,从而得到结构化查询语句的总体逻辑骨架,进而填充语义要素以丰富骨架细节,得到最终的结构化查询。 (3)在3个常用的复杂问题的知识库问答数据集上进行了验证,实验结果表明,本文提出的方法取得了良好的表现,针对复杂问题的处理取得了不错的效果。同时,实验分析了语义要素检测对最终结构化查询生成的影响,SPARQL-Tree作为中间状态的作用,验证了本文提出的知识库问答方法的有效性。 本工作的意义在于,为复杂问句的知识库问答任务提供了一整套有效且可解释的解决方案。通过分析整个语义解析的流程,可以有效的理解复杂句的语义分析以及结构化查询的构建过程,同时还可以辨别出整个问答任务中误差出现的原因,对于今后更加复杂的问答场景具有借鉴意义。

关键词

知识库问答/复杂问句/语义要素/结构化查询生成/SPARQL-Tree技术/实体链接

引用本文复制引用

授予学位

硕士

学科专业

软件工程

导师

李慧颖

学位年度

2021

学位授予单位

东南大学

语种

中文

中图分类号

TP
段落导航相关论文