查看更多>>摘要:目的 探究基于肠道菌群对人群未来患帕金森症(parkinson's disease,PD)的早期预测模型进行构建与评价,并对肠道菌群宏基因KO组进行功能分析,探讨PD的潜在治疗靶点.方法 基于Zenodo数据库,一方面对肠道菌群相对丰度数据进行标准分数标准化及ZicoSeq降维,采用基于自适应最小绝对收缩和选择算法(least absolute shrinkage and selection operator,LASSO)变量选择的logistic回归算法建立预测模型,使用受试者工作特征(receiver operating characteristic,ROC)曲线下面积(area under curve,AUC)和校准曲线评价模型预测效能,采用临床决策曲线(decision curve analysis,DCA)进行临床使用价值的评价;另一方面,对肠道菌群宏基因KO组数据使用limma包鉴定差异表达基因(differentially expressed genes,DEGs),对DEGs进行基因本体(gene ontology,GO)和京都基因与基因组百科全书(Kyoto encyclopedia of genes and genomes,KEGG)分析.通过结合蛋白质相互作用网络(protein-protein interaction networks,PPI)、支持向量机-递归特征消除(support vector machine-recursive feature elimination,SVM-RFE)和随机森林(random forest,RF)对DEGs进行筛选.结果 基于自适应LASSO变量选择的logistic回归分析模型的ROC曲线以及校准曲线显示模型预测效果良好.DCA结果显示模型净收益较大.通过PPI网络分析及机器学习方法,最终筛选出6个核心DEGs,即阿拉伯糖转运系统渗透蛋白(L-arabinose operon Q,araQ)、甘油醛-3-磷酸脱氢酶,Ⅱ 型、dCTP 脱氨酶(dCTP deaminase,dcd)、颗粒 19 kDa蛋白(signal recognition particle 19,SRP19)、加工前体5,核糖核酸酶P/MRP亚基(芽殖酵母)[processing of precursor 5,ribonuclease P/MRP subunit(S.cerevisiae),POP5]、肌醇-3-磷酸合酶 1(inositol-3-phosphate synthase 1,ISYNA1).结论 基于自适应 LASSO 变量选择的 logistic 回归分析模型对PD的预测具有优势,从而实现对PD患者的早发现、早干预、早治疗;相关核心基因的发现为PD的治疗提供科学指导和帮助.