摘要
中医体质可以预示疾病的发展倾向,是中西医结合新医学“辨体-辨病-辨证”的重要组成部分。然而传统中医体质辨识大多依赖于被试者的主观感受,并且还存在着专业性强、耗时长等缺陷。鉴于此,本文研究中医望诊特征和问诊特征与中医体质之间的规律性,提取显著相关的特征,构建中医体质辨识知识图谱,并将知识图谱技术和图表示学习算法应用到中医体质辨识领域,完成基于知识图谱的中医体质辨识系统设计,实现了中医体质辨识智能化。 本文利用数据挖掘方法从教材、权威临床指南和文献中挖掘知识本体,构建本体知识库。接着设计了中医体检实验流程,将实验应用到某中医药大学的学生体检中进行数据采集,对采集的数据进行数据预处理,统计分析客观化特征与中医体质之间的规律。研究结果发现,性别、BMI指数、舌色、苔色、胖瘦舌、面色、唇色、两颧潮红和眼眶周围暗黑等中医客观化特征在体质类别分布上存在统计学差异(Plt;0.05)。裂纹舌、齿痕舌、点刺舌、剥落苔、厚薄苔、腐腻苔、面部光泽度等特征与体质类别分布在统计学上没有明显的差异(Pgt;0.05)。 基于上述特征,本文利用知识图谱技术构建了中医体质辨识知识图谱,研究将采集的实验数据作为实体数据,用图模型的形式来描述实体间的关联关系,即人与客观化特征、体征之间的关系,例如:学生甲是女生、学生甲表现出手脚发冷、学生甲表现为阳虚质等多种三元组关系。 结合上述体质辨识知识图谱,本文设计了基于图结构的知识推理算法Metapath2vec+SVM(SupportVectorMachine,支持向量机),利用已知数据实体间隐藏的关联关系来推测未知新数据的体质类别。Metapath2vec算法基于随机游走(Random-Walk)和跳字模型(Skip-Gram),生成带有语义信息的图节点的向量表示形式,用于分类预测。对比该知识推理算法与仅使用模式识别方法或者仅使用相似性算法进行体质辨识的效果,发现基于Metapath2vec模型的知识推理方法预测性能最佳,准确率高达81.64%。此结果验证了中医望诊舌面象客观特征的有效性,为探索新的中医体质辨识方法提供了有效参考。 最终,本文开发出一个基于B/S(Browser/Server)架构的智能中医体质辨识系统,实现了中医体质辨识知识图谱可视化、知识查询检索数据化等功能,利用上述知识推理方法预测体质,方便患者快速地了解自身的体质情况,完成智能体质辨识。