摘要
当前,随着中医现代化进程不断加快,医疗服务质量的不断提升,中医辅助诊断已成为中医学发展的必然趋势和方向。中医辅助诊断技术结合中医诊断思维和人工智能技术,对患者信息进行智能分析和处理,能够帮助中医师更准确地进行疾病辨证施治,提高医疗效率和质量。中医理论的核心为辨证论治,是治疗疾病与中医诊断的基本原则,中医电子病历中蕴含了大量中医师的临床诊疗经验和患者的医疗诊断数据,挖掘中医电子病历中蕴含的丰富辨证论治经验具有重要的现实意义。 中医证候是通过望诊、闻诊、问诊、切诊信息所获知的疾病过程中某阶段以及患者个体表现在当时所处特定内外环境下本质的反映,它为辨证论治提供依据。证候可进行病因、病机、病位的划分,病因、病机、病位各自又含有多个类别,且类别之间可以相互组合。在对证候进行分析预测时,只是将其看作简单的文本二分类及多分类问题,通过疾病过程中某个阶段呈现的相对稳定的证候划分类别,对其进行简单的因果推断忽略了证候结论之间所存在的并列关系,易导致临床上重要病情信息的忽略,影响辨证施治的效果。中医文本含有大量的中医领域专业术语,上下文词语间的关联性较强且含有表述严谨和富有辨证思维的文言文,专业性较高,在进行文本表征与语义理解时,难度较大。针对上述问题,本文以江西中医药大学岐黄国医书院所提供的中医哮喘电子病历为数据实例开展实验研究。 本文主要工作内容如下: (1)针对中医领域中的大量未标注文本,以及传统多标签分类模型提取的文本语义信息不够完整等问题,基于深度学习的方法提出一种语义筛选的ALBERT-TextCNN中医文本多标签分类模型。首先进行特定领域任务自训练,将哮喘领域内的未标注文本输入ALBERT进行多标签分类模型的预训练;其次ALBERT多层的Transform对已标注数据进行动态向量化表示,基于语义筛选选取最佳编码层生成的高效文本向量;最后,引入TextCNN建立多标签分类器,提取文本向量不同层次的语义信息特征。为了验证方法的有效性,在中医数据集上进行测试,实验结果表明,该模型的分类精度有所提高。 (2)针对传统多标签分类模型未充分考虑当前文本中临近标签之间存在的复杂关联性问题,提出一种基于局部注意力Seq2Seq的中医文本多标签分类方法。首先利用ALBERT模型提取文本的动态语义向量;然后多层Bi-LSTM构成的编码层用于提取文本间的语义关系;最后解码层中使用多层LSTM的局部注意力,突出文本序列中临近标签之间的相互影响力,以预测多标签序列。在中医文本数据集上进行验证,证明了所提出的算法能够成功地捕获标签之间的相关性,适用于中医文本的分类预测。 (3)在以上研究基础之上,结合实际临床辅助诊断应用的需求,本文采用PYTHON编程语言和相关开发工具,基于Flask框架在Web端设计并开发中医哮喘的辅助诊断系统。