中文信息学报2024,Vol.38Issue(7) :95-105.

一种基于级联架构与多模型融合的知识型对话系统

A Cascading-Architecture and Multi-Model Fusion Based Knowledge-Grounded Dialogue System

张松鸣 王帅博 陈钰枫 任泓洁 胡珊珊 徐金安
中文信息学报2024,Vol.38Issue(7) :95-105.

一种基于级联架构与多模型融合的知识型对话系统

A Cascading-Architecture and Multi-Model Fusion Based Knowledge-Grounded Dialogue System

张松鸣 1王帅博 1陈钰枫 1任泓洁 1胡珊珊 2徐金安1
扫码查看

作者信息

  • 1. 北京交通大学计算机与信息技术学院,北京 100044
  • 2. 北方工业大学信息学院,北京 100041
  • 折叠

摘要

知识对话任务旨在借助外部知识生成富信息的回复,主要包括用于知识检索的Query生成和融合知识的对话生成两方面.如何有效地生成知识检索Query以及高效地利用所检索到的知识生成对话仍是一个挑战.为了解决以上的问题,该文提出了一种基于级联式架构和多模型融合的知识型对话系统.针对知识检索Query生成任务,为了高精确率地检索知识,提出级联式解耦策略,即将知识检索Query生成任务划分为知识检索判别任务和检索Query生成任务.针对融合知识的对话生成任务,为了提高对话的一致性和多样性,首先进行了对话任务预训练,然后引入了多种对话训练策略进行训练,得到了多个高质量对话生成模型.基于不同对话模型产生的回复,提出了一种基于互投票的重排序策略.最终,该文所介绍的系统在"2022语言与智能技术竞赛:知识对话任务"中取得了 自动评估第一名、人工评估第三名的成绩.

Abstract

Knowledge-grounded dialogue is a task of generating an informative response based on external knowledge,mainly including query generation for knowledge retrieval and knowledge-grounded dialogue generation.This paper presents a cascading-architecture and multi-model fusion based knowledge-grounded dialogue system.For query generation task,this paper proposes a cascade decoupling strategy,that is,knowledge retrieval query genera-tion task is divided into a knowledge retrieval discrimination task and a retrieval query generation task.In order to improve the consistency and diversity of dialogue,this paper introduces a variety of dialogue training strategies after dialogue pre-training to establish several competitive dialogue models with high qualities.For the responses generated by different dialogue models,this paper proposes a re-ranking strategy based on mutual voting.The sys-tem proposed in this paper ranked the 1st in the automatic evaluation and 3rd in the human evaluation in the"2022 language and intelligent technology competition:knowledge dialogue track".

关键词

知识检索/知识型对话/重排序

Key words

knowledge retrieval/knowledge-grounded dialogue/re-rank

引用本文复制引用

基金项目

国家自然科学基金(61976016)

国家自然科学基金(61976015)

国家自然科学基金(61876198)

国家重点研究与发展计划(2020AAA0108001)

出版年

2024
中文信息学报
中国中文信息学会,中国科学院软件研究所

中文信息学报

CSTPCDCHSSCD北大核心
影响因子:0.8
ISSN:1003-0077
段落导航相关论文