基于实体感知的医疗对话生成算法研究

熊龙祥¹

扫码查看

作者信息

1. 北京交通大学
折叠

摘要

近年来，医疗对话系统在学术界和工业界受到广泛关注。本论文研究医疗对话系统的子任务医疗对话生成技术，旨在提高系统性能，优化医患体验。现有研究通常引入实体概念表示专业词汇，并引入实体预测和实体感知的对话生成框架以提高自然性和可靠性，但现有方案存在以下局限性:（1）实体预测模型通过知识图谱引入的实体间关系不足，且容易引入大量噪声，且模型未能充分利用对话上下文关系。（2）在生成对话时未充分发挥实体作用，导致信息损失严重。为了解决上述问题，本论文基于真实医疗对话数据集，针对性的设计了独特的知识图谱引入、实体预测和增强的对话生成算法，具体贡献如下: （1）知识图谱引入和实体预测算法:首先，利用Word2Vec学习实体表征之间的相关性，以增强图谱中疾病及其它实体之间的相关性，去掉图谱中不重要的边,减少与对话无关的图谱内容的干扰。其次，改进了现有的GEML实体预测模型，增加了第一层图注意力网络用以捕捉句子之间的关系，并在第二层图注意力网络中引入了整个对话的信息。实验表明:上述两个方法有效地改进了实体预测的准确率。相对于现有算法，F1Score提高了22.4％。（2）实体增强的对话生成模型:首先，提出了一种实体和对应句子相互重构的预训练方式来增强实体的作用。然后，生成对话时使用时序模型来捕捉实体和对应类别在对话过程中出现的规律，并使用注意力机制来关注重要信息，在与历史对话信息融合后得到实体增强的对话生成模型。实验表明:上述两个方法使生成的对话在自然性和可靠性上都有提高。相比于现有模型，在BLEU-1和BLEU-2上分别提升63％和100％,在Distinct-1和Distinct-2上分别提升71％和129％。本文最后介绍上述模型在景区流量预测中的应用。研究发现:实体预测模型的核心是利用实体之间的关系及它们与对话上下文关系（这些关系可以用图模型来描述）来进行预测，与景区流量预测相通。因此，本文提出关系增强的景点流量预测。具体来说，在利用景点历史流量的相关性和因果性进行建图之后，充分利用景点间关系及其流量时间依赖性，以准确预测景点流量，解决现有方法难以描述不相邻景点间的相关性及数据稀疏的问题。在真实数据集上的实验结果表明,本文提出的算法比现有算法获得了更高的流量预测准确性:相较基线方法，NRMSE改进了2.089％。本文提出的基于实体感知的医疗对话生成系统，有助于提升医疗对话生成的自然性和可靠性，具有广泛应用前景。

关键词

对话生成/实体预测/知识图谱/图注意力网络/Word2Vec技术

引用本文复制引用

授予学位

硕士

学科专业

信息与通信工程

导师

郭宇春

学位年度

2023

学位授予单位

北京交通大学

语种

中文

中图分类号

段落导航