查看更多>>摘要:目的:通过生物信息学的方法挖掘帕金森病(Parkinson's disease,PD)的关键基因,为PD提供新的诊断标志物及免疫细胞浸润特征.方法:从高通量基因表达(gene expression omnibus,GEO)数据库下载合并GSE20163 和GSE20164 数据集并筛选差异表达基因(differential expression genes,DEGs).采用基因本体(gene ontology,GO)和京都基因和基因组百科全书(kyoto encyclope-dia of genes and genomes,KEGG)数据库分析预测DEGs的生物学功能,然后进行加权基因共表达网络分析(weighted gene co-expression network analysis,WGCNA)识别PD相关模块基因,并对DEGs和PD相关模块基因取交集,使用最小绝对收缩和选择算法(least absolute shrinkage and selec-tion operator,LASSO)回归分析缩小交集基因并确定PD关键基因,最后对关键基因进行免疫浸润分析,并用数据集GSE49036 对上述4 个基因进行验证.结果:共筛选出34 个DEGs,主要与神经递质转运、学习记忆和认知等生物学过程相关.共获得WGCNA关键模块基因41 个,与DEGs取交集获得 19 个交集基因,最终通过LASSO回归分析确定SLC18A2、SV2C、CUX2 和CALB1 共4 个PD关键基因,根据受试者工作特征(receiver operating characteristic,ROC)曲线显示4 个关键基因诊断PD的准确度较高.与对照组相比,PD中未成熟树突状细胞以及γδT细胞表达相对较低,嗜中性粒细胞细胞表达较高.数据集GSE49036 验证发现,SLC18A2、SV2C和CUX2 在PD和对照组中基因表达差异有显著性意义,且ROC曲线显示诊断PD的准确性较高,而CALB1 基因表达差异不显著.结论:利用生物信息学方法筛选出4 个PD关键致病基因,首次报道CUX2 基因与PD相关性,为PD的诊断和疾病的发生发展机制提供新的线索.