查看更多>>摘要:目的 通过生物信息学和机器学习筛选寻常型银屑病(psoriasis vulgaris,PV)血热证(blood-heat syndrome,BHS)、血瘀证(blood stasis syndrome,BSS)及血燥证(blood-dryness syndrome,BDS)的重要特征基因,为不同中医证型PV的临床诊疗提供科学依据.方法 从基因表达数据库(Gene Expression Omnibus,GEO)下载GSE192867数据集,利用limma包筛选患者与健康人群的PV、BHS、BSS及BDS差异表达基因(differentially expressed genes,DEGs),并进行KEGG(Kyoto Encyclopedia of Genes and Genomes)通路富集分析.将PV、BHS、BSS及BDS筛选出的DEGs分别取交集,获取不同的特征基因.利用支持向量机(support vector machine,SVM)和随机森林(random forest,RF)两种算法中效能最优的方法对特征基因进行分析,将排序前5的基因作为重要特征基因,并利用pROC包绘制重要特征基因的受试者工作特征(receiver operating characteristic curve,ROC)曲线,计算曲线下面积(area under the curve,AUC),评价其诊断效能.结果 筛选出与PV、BHS、BSS以及BDS相关的DEGs数量分别为7 699个、7 291个、7 654个和6 578个.KEGG富集分析主要集中在Janus激酶(Janus kinase,JAK)/信号转导与转录激活因子(signal transducer and activator of transcription,STAT)、环磷酸腺苷(cyclic adenosine monophosphate,cAMP)、丝裂原活化蛋白激酶(mitogen-activated protein kinase,MAPK),以及细胞凋亡等通路.通过机器学习共筛选出13个重要特征基因,其中凝集素(malectin,MLEC)、TUB样蛋白3(TUB like protein 3,TULP3)、含SET域9(SET domain containing 9,SETD9)、核膜整合膜蛋白2(nuclear envelope integral membrane protein 2,NEMP2)和BTG抗增殖因子3(BTG anti-proliferation factor 3,BTG3)是BHS的重要特征基因,双特异性磷酸酶15(dual specificity phosphatase 15,DUSP15)、C1q与肿瘤坏死因子相关蛋白7(C1q and tumor necrosis factor related protein 7,C1QTNF7)、溶质载体家族12成员5(solute carrier family 12 member 5,SLC12A5)、含三联基元63(tripartite motif containing 63,TRIM63)和泛素相关蛋白样因子1(ubiquitin associated protein 1 like,UBAP1L)是BSS的重要特征基因,重组小鼠蛋白(recombinant mouse protein,RRNAD1)、GTP酶激活蛋白ASAP3蛋白(ASAP3 protein,ASAP3)和人肌间蛋白2(human myomesin 2,MYOM2)是BDS的重要特征基因,且PV不同证型的特征基因ROC曲线均表现出较高诊断效能.结论 PV不同证型的特征基因存在显著差异,其可能成为潜在的诊断PV中医证型的生物标志物.