首页|基于多源数据知识图谱的医疗问答系统研究

基于多源数据知识图谱的医疗问答系统研究

王浩雄

基于多源数据知识图谱的医疗问答系统研究

王浩雄1
扫码查看

作者信息

  • 1. 大连大学
  • 折叠

摘要

在新时期全方位开放格局中,医疗始终是民众重要的基础保障。尤其在疫情期间,隔离政策导致线下问诊难,许多疾病患者的健康问题因无法得到及时正确的反馈从而错失最佳治疗时机。因此,如何便捷准确地检索到对日常疾病有帮助的医疗知识变得十分重要。患者使用医疗网站或检索工具获取医疗信息时,会存在信息冗余、定位不准确、质量参差不齐等问题,导致花费大量时间却没有获取到可靠的解决方法。针对上述问题,本文搭建了基于多源知识图谱的医疗问答系统,系统以多源医疗数据知识图谱为系统数据支撑,结合基于深度学习的意图识别文本分类模型,最终实现智能问答和知识图谱展示。该系统的实现对于整合医疗信息资源和解决用户医疗问题具有极其重要的理论与实际意义。本文的研究内容如下: (1)提出基于M-knrm算法的知识融合方案,用于多源医疗知识图谱的构建。以结构化的开源医疗知识图谱和半结构化的医疗网站数据为基础,将不同来源的数据通过基于M-knrm文本相似度匹配的知识融合方法进行数据融合,为构建稳定高质量的知识图谱奠定基础。此外,对融合后的数据进行整理分类,并以三元组的形式保存到Neo4j图数据库中,构建出包含实体、关系和属性的医疗知识图谱。 (2)提出MSSA-TextCNN模型,用于问答系统中意图识别文本分类的任务。首先,通过添加佳点集、正弦余弦算法和Levy飞行三种策略对麻雀搜索算法SSA进行改进得到MSSA,经单峰函数和多峰函数验证,多策略改进的麻雀搜索算法MSSA在极值寻优方面有了极大的提升;其次,将MSSA用于TextCNN模型参数寻优,通过MSSA寻优的特性使TextCNN模型收敛性更好,模型的分类精度也得到提高。实验结果证明,MSSA-TextCNN模型优于其他文本分类模型,能更加精准对问答系统中用户的提问进行分类,从而使问答系统中意图识别效果得到进一步的增强。 (3)设计与实现基于多源数据知识图谱的医疗问答系统。问答系统以多源数据构建的知识图谱为基础,使用MSSA-TextCNN意图识别模型对医疗问题进行分类预处理,最后通过Vue加Flask分别构建出前后端,搭建出基于多源数据的医疗问答系统。经过测试验证,本文设计和搭建的智能问答系统能够很好地理解用户提出的医疗问题并作出正确的回答,从而帮助患者高效地获取医疗知识。

关键词

知识图谱/智能问答系统/意图识别/医疗诊断/多源数据

引用本文复制引用

授予学位

硕士

学科专业

计算机技术

导师

高兵

学位年度

2023

学位授予单位

大连大学

语种

中文

中图分类号

TP
段落导航相关论文