摘要
多方对话阅读理解任务旨在理解一段由多个对话角色共同参与所产生的对话内容,并回答与之相关的问题。在真实的多方聊天场景下,谈话主题的频繁转变以及多个对话角色间随机的发言顺序,导致对话结构错综复杂,这意味着需要对跨语句和跨角色的信息点进行有效梳理与整合。基于深度神经网络的多方对话阅读理解任务已经取得长足进展,但是它们仍面临着几大瓶颈:(1)对多方对话的特征挖掘不足导致建模维度单一;(2)忽略多方对话文本的深层语义信息;(3)未能有效解决复杂的跨句指代问题。为了缓解上述问题,本文从多方对话的文本特性挖掘和可行建模策略两大脉络同时进行探索,主要研究内容如下: (1) 针对多方对话文本特征建模单一的问题,本文提出一种结合多维信息的分层图卷积多方对话阅读理解方法,在话语单元的关注级别下,对话语间的结构关系、对话角色特性以及问题-上下文间的交互特性进行分层次的建模。方法整体侧重于关注多方对话文本中固有的一些显式特征,并行考虑了多个显著的对话特性。利用话语结构关系来直观地反映话语间的信息流向,将无规律的话语以对话角色为单元进行整合来感知对话意图等特性,从问题文本出发在多方对话上下文中进行关键信息定位。本文有效地探索了多方对话文本的建模体系,显著提高了模型的多方对话阅读理解能力。 (2) 为了缓解多方对话文本深层语义挖掘不足的问题,本文提出一种注入常识背景的多维信息异构图多方对话阅读理解方法,从对话全局的关注视角下,引入外部的常识知识来为模型赋予隐含语义捕获能力。方法从一个被广泛使用的常识知识图谱ConceptNet中对各话语单元中隐含的常识背景知识进行检索,设计了剪枝策略来确保检索到的常识知识的相关性。构建了一幅包含问题文本、对话角色、话语单元和常识知识单元在内的对话异构图,并设计了详尽的连接关系来对这些不同元素间的复杂交互信息进行建模。本文验证了通过常识知识的融合,模型具备更深层的语义理解能力。 (3) 针对多方对话文本中杂糅的指代问题,本文提出一种融入指代关系的多维信息图注意力多方对话阅读理解方法,从字词元素的角度出发来关注文本内部的跨句跨角色指代关系。方法结合了双粒度特征信息建模的优势,利用粗粒度的话语结构关系和基于对话角色感知的时序信息来捕捉多方对话的浅层语义。进一步将关注视角下沉到字词级别,利用细粒度的指代关系对文本内部的多跳指示词进行标识与聚合。方法对多方对话文本进行了由粗到细的语义逻辑梳理,使模型具备更为鲁棒的多方对话阅读理解能力,达到当下最先进的性能。 综上,本文同时在多方对话特征挖掘和建模方法两个大视角下进行探索,利用多元特征信息为模型赋予丰富的语义建模能力,极大地缓解了多方对话阅读理解任务当前所面临的瓶颈问题。本文构建了严谨的实验环节和详实的分析过程证明了所提出的方法可以有效地解决对应问题。