摘要
目的 利用机器学习法和转录组数据,预测炎症性肠病(Inflammatory dowel disease,IBD)患者对英夫利昔单抗(Infliximab,IFX)的应答情况.方法 使用基因表达综合数据库(GEO),下载IBD患者接受英夫利昔单抗治疗前的肠道黏膜 mRNA 表达谱(GSE16879),使用limma包筛选应答患者(20 例)和失应答患者(23 例),共 43 例患者的差异基因;基于 LASSO 和SVM-RFE的机器学习法,分别筛选出预测基因及共同基因,并构建预测模型.基于ROC 曲线进行效能评估,并通过联合诊断法优化模型.结果 共筛选出 182 个差异表达基因,其中上调基因为 17 个,下调基因为 165 个;LASSO 及SVM-RFE机器学习法分别筛选出 15 个和 22 个差异基因,其中两者共同筛选出 chordin样蛋白 2(CHRDL2)、白细胞介素 13 受体 A 2(IL13RA2)、金属酶蛋白 10(MMP10)和S100 钙结合蛋白 A9(S100A9)等 4 个基因.构建出用于预测首次接受IFX治疗的IBD患者的应答情况的模型(Logistics 回归模型=-59.212 2+1.951×S100A9+0.758 1×IL13RA2+1.694 2×MMP10+4.042 1×CHRDL2),其曲线下面积(AUC)=0.996,灵敏度为 95.7%,特异度为 100%.结论 基于机器学习法,使用肠道黏膜 mRNA表达谱构建出预测IBD患者对IFX治疗应答情况的模型.
基金项目
新疆维吾尔自治区自然科学基金杰出青年科学基金(2022D01E25)