基于深度学习的任务型对话系统研究

姚震¹

扫码查看

作者信息

1. 福州大学
折叠

摘要

任务型对话系统是一类旨在实现机器与用户间的双向对话，最终为用户提供具体服务的“人-机”交互系统，成为自然语言处理领域的热门研究方向，广泛应用于工业生产和日常生活。但目前仍有许多问题需要解决：现有方法仅利用领域或动作等单一语义特征完成回复解码操作，难以生成语义丰富的系统回复；各类对话信息彼此独立输入模型，难以捕捉历史对话中的深层语义信息和各输入间的依赖关联；忽略对词级语义信息的挖掘，难以学习细粒度层面的语义信息。针对以上问题，本文展开以下三方面研究：第一，针对现有模型仅使用单一语义特征生成的系统回复语义不够丰富的问题，提出了一种基于多语义特征回复生成网络的对话模型。首先为全局语义信息和用户对话中的领域和动作特征分别构建双向门控循环单元作为回复生成网络；然后三类回复生成网络进行解码操作获得包含语义信息丰富的候选回复集合；最后自适应选择网络筛选出最符合用户要求的候选回复作为最终回复。实验结果表明，在 MultiWOZ 2.0 和 MultiWOZ 2.1 两个对话数据集上，Inform值最高提升9.0%，Success值最高提升10.5%，BLEU值最高提升1.6%，Combined Score值最高提升10.3%。第二，针对现有模型难以挖掘对话历史中深层语义信息和各输入信息间依赖关联的问题，提出了一种基于多元注意力网络的对话状态跟踪模型。首先使用多头注意力机制捕捉对话历史中的深层语义信息和各信息间的依赖关联；然后使用二次注意力模块进行信息融合和修正；最后借助高速网络保护各类信息自身完整性。实验结果表明，在 MultiWOZ 2.0 和 MultiWOZ 2.1 两个对话数据集上，Inform值最高提升0.5%，Success值最高提升2.1%，BLEU值最高提升1.6%，Combined Score 值最高提升 2.0%。第三，针对现有模型难以挖掘字词级细粒度语义信息的问题，提出了一种基于文本与词汇双路语义学习网络的对话模型。首先将用户对话与对话领域、对话动作先后做注意力操作，得到词汇级语义表征向量；然后将该向量与文本级语义表征向量做融合操作，获得文本和词汇双层语义信息；最后本文还提出一类“领域-动作”回复生成网络，在保证回复质量的同时提升模型运行效率。实验结果表明，在 MultiWOZ 2.0 和 MultiWOZ 2.1 两个对话数据集上，Inform 值最高提升2.0%，Success值最高提升3.3%，BLEU值最高提升0.7%，Combined Score值最高提升1.8%。

关键词

任务型对话系统/信息挖掘/语义特征/注意力机制/深度学习

引用本文复制引用

授予学位

硕士

学科专业

软件工程

导师

廖祥文

学位年度

2023

学位授予单位

福州大学

语种

中文

中图分类号

段落导航