摘要
在医学科技飞跃发展的今天,心血管疾病在中国的发病率却逐年增加,并且年龄趋于年轻化。中医诊疗注重个性化辨证论治,能够有效弥补西医单靶点治疗的不足,具有巨大优势和良好的发展前景。中医临床诊疗病案蕴含了医生对于相关疾病的宝贵诊疗规则,但因其文本中中医术语的多样性、复杂性,难以被有效利用。因此,需要利用自然语言处理技术对其进行信息抽取,并将抽取后的实体及实体关系进行关联分析,挖掘出名老中医诊疗规则,有利于在临床指导医生进行个性化辨证论治,提高临床疗效,有助于传承和发扬中医经验。 本研究基于自适应词嵌入RoBERTa-WWM预训练模型与关联分析等技术,挖掘名老中医李铁军临床医案中的诊疗规则,具体研究工作包含以下三个部分: 第一,命名实体识别。为了解决中医文献中语义缺失、命名实体嵌套等问题,提升实体识别效果,提出基于自适应词嵌入RoBERTa-WWM的名老中医临床病案命名实体识别模型。该模型在名老中医李铁军治疗心血管疾病的临床病案数据集上取得了86.88%的F1值,相比RoBERTa-WWM-CRF和Bert-CRF模型的F1值,分别提高了5.93%和5.87%,在速度上也有所提升。 第二,实体关系抽取。为了构建大规模的中医疾病诊断知识图谱,需要从非结构化中医临床病案文本中提取实体、关系和属性组成的三元组信息。为减少现有相关模型架构先实体识别再关系抽取导致的误差放大、三元组重叠问题,本研究构建了一个新的实体关系联合抽取模型RSLSGP(RoBERTaBiLSTMSigmoid),该模型在名老中医李铁军治疗心血管疾病的临床病案数据集上取得65.58%的F1值,本模型的F1值比SFFM模型、Multi-TPLinker模型和OneRel模型分别提高了1.84%、2.1%、3.12%和3.41%。实验结果说明基于RSLSGP模型可以提高中医临床病案实体关系抽取的效果。 第三,诊疗规则挖掘。将前两个章节所获得得实体以及实体间的关系整理成CSV文件,利用Apriori算法进行关联规则挖掘,挖掘名老中医李铁军临床诊疗心血管疾病的隐含经验与用药规律。并利用Neo4j技术构建名医心血管疾病诊疗知识图谱,以便实现基于知识图谱的名医经验智能查询和临床决策支持。 本研究针对名老中医临床病案,构建了自适应词嵌入RoBERTa-WWM模型进行中医实体抽取,利用RSLSGP模型进行中医实体关系抽取,并基于这两个模型的实验成果,进行名老中医诊疗规则挖掘和知识图谱的构建,为中医临床辅助决策和名医经验传承提供了参考。