基于知识增强的对话摘要技术研究

赵璐璐¹

扫码查看

作者信息

1. 北京邮电大学
折叠

摘要

作为自然语言处理领域最重要的任务之一，文本摘要旨在将一段长的复杂文本压缩为一个简洁的表示。在人工智能时代，这项技术不但是人们在互联网大数据中快速获取核心信息的有效手段，也为开发各种其他智能系统提供了重要的支持。近年来，随着以对话为主要形式的通信方式逐渐占据了人们的生活，对对话内容进行总结，即对话摘要，受到了越来越多研究者的关注。考虑到大多数现有的文本摘要研究工作都集中在单语者文档上，它们通常以第三人称视角阐述核心思想，信息流通过段落或章节表达的非常清晰。与这些结构化文档不同，对话通常是非正式的、冗长的和重复的，散布着错误的开始、反向引导、再次确认、犹豫、说话者打断等问题，并且重要的信息散布在整个对话中，这使得当前的摘要模型很难专注于多个信息丰富的话语。并且，非正式用语、缩写和表情符号等都为摘要任务带来了新形式的挑战。本文针对对话摘要生成这一任务，分别利用主题知识，结构知识，事实知识、对话状态知识和领域知识对闲聊对话场景、会议对话场景和面向任务型对话场景中的一些关键问题展开了研究，取得了具有一定理论意义和应用价值的成果。本文的研究内容包括: 主题知识增强的对话摘要生成:提出了一种主题词引导的对话图注意力模型。利用对话中的主题知识设计一个主题词增强的图到序列网络，其中的指针生成网络不但从词汇表中生成新的token,而且从对话原文中拷贝已有的token,一定程度上解决了Out-Of-Vocabulary(OOV)的问题。通过这种方式，关于不同主题的讨论更容易被清楚的梳理以形成对应的信息流。实验结果表明该方法提高了模型对主题知识的关注以及生成摘要的流畅性和信息丰富度。结构知识增强的对话表示:提出了一种多交互引导的双拷贝知识网络。利用说话人感知结构的知识模拟人类交流过程并且捕获跨句依赖的关系。通过挖掘对话中的事实感知结构来构造一个事实图以将现有的事实描述编码到摘要系统中。利用这两种结构知识能够帮助人们打破顺序化思考的逻辑以生成准确的事件描述。实验结果证明了该方法可以有效的建模对话内容和对对话内容进行表示。事实知识增强的事实一致性研究:提出了一种语义槽引导的对抗性序列到序列网络。通过从异构语义槽图上拷贝相应的槽值设计一个槽级别注意力机制并且设计一种槽驱动的波束搜索算法以控制的方式优先生成显著元素。实验结果验证了该模型能够有效的整合事件的碎片化信息，并且可控地生成更具事实性的摘要。对话状态知识增强的面向任务型对话摘要数据集构建:构建了一个面向任务的对话摘要数据集TODSum，以及利用相应的对话状态知识，并建立了一个综合基准。采用大规模自动注释辅助小规模人工注释的方法迭代地提高数据集的质量。此外，提出了一种状态感知事实一致性指标。详尽的定性分析和实验验证了TODSum是一个高质量的数据集以及对话状态信息对于面向任务型对话摘要的有效性。领域知识增强的零样本对话摘要探索:依次提出了一种面向领域的前缀调整方法和一种对抗性解耦提示学习方法，以率先探索了对话摘要任务领域自适应中的微调方法。将领域知识视为提示与大规模预训练语言模型进行交互以促进不同领域知识的解耦。并且，为TODSum数据集和QMSum数据集建立了两个实用且全面的基准。实验结果表明了上述模型不仅具有良好的领域泛化能力还具有很高的鲁棒性。

关键词

对话摘要生成/自然语言处理/知识增强

引用本文复制引用

授予学位

博士

学科专业

信息与通信工程

导师

郭军

学位年度

2023

学位授予单位

北京邮电大学

语种

中文

中图分类号

段落导航