摘要
伴随着人工智能的快速发展,人机对话技术也变得日益成熟,应用范围也越来越广泛。口语理解是任务型对话系统不可或缺的组成部分,其核心在于将用户的话语输入转化为如意图和语义槽等结构化语义表示,传统方法的不足在于忽视了意图识别和语义槽填充之间的相关性。因此当前的研究主要采用联合建模的方法,即通过一个联合模型同时处理这两个任务,共享模型所学习到的特征,从而使两个任务相互促进。由于对话系统的场景复杂多样,不同任务的语言表达方式和语义含义有很大的差异性,因此需要针对不同形式的对话进行特定的模型设计,本文从单轮单意图对话、多轮对话和多意图对话三个方面进行口语理解联合建模研究。 (1)在单轮单意图对话的基础上,提出了一种基于注意力胶囊网络的口语理解联合模型。通过引入中文词信息来更好地捕捉用户的语义信息,利用注意力胶囊网络来对话语中的字、词、语义槽和意图之间的层次关系进行建模,使模型能够更有效地检测单词边界,改善口语理解性能。实验表明:该模型在CAIS和ECDT-NLU数据集上得到了较好的结果,在 CAIS 上意图识别准确率达到 94.82%,语义槽填充 F1 分数达到88.36%;在ECDT-NLU上意图识别准确率达到79.94%,语义槽填充F1分数达到49.62%,与其他模型相比,具有较好的性能。 (2)在多轮对话的场景下,提出一种基于上下文信息的口语理解联合模型。通过基于图卷积神经网络实现的记忆融合层来融合历史轮对话信息,使模型充分利用会话中蕴含的上下文信息。在NLPCC2018任务4的多轮对话数据集上进行实验,意图识别准确率达到88.92%,语义槽填充F1分数达到88.69%,相比其他模型表现更出色,表明本模型可以充分利用上下文信息,以提升意图识别和语义槽填充任务的表现,从而取得最优效果。 (3)在多意图对话的基础上,提出了一种融合句法分析的多意图口语理解联合模型。该模型通过对句子进行依存句法分析来获得语法特征,采用键-值记忆网络利用依存句法知识,将句子的结构信息融入到意图识别和语义槽填充中,不仅可以准确理解口语信息,还能更加充分地提取隐含的语义信息。通过实验分析,在DSTC4、MixATIS和 MixSNIPS 这三个数据集上的意图识别准确率分别达到 44.55%、75.55%、95.06%,语义槽填充F1分数达到53.62%、88.36%、94.98%,表明本文所提出融合句法分析的多意图口语理解模型具备更强的细节捕捉能力和性能提升效果。