查看更多>>摘要:目的 识别结直肠癌中的差异表达基因(DEGs),探索结直肠癌的关键通路和基因.方法 选取来自基因表达综合数据集的基因表达谱GSE211496、GSE6988和GSE29900数据集,使用GEO2R分析工具进行分析并下载相关数据,通过在线数据库miRDB和TargetScan对GSE29900数据集的差异miRNAs进行靶基因预测,然后使用韦恩图取3个数据库的DEGs交集,使用DAVID数据库工具进行GO和KEGG通路富集分析,接着使用PPI进行网络构建并由Cytoscape软件进行可视化,使用TCGA数据库验证Hub基因表达,使用pROC包对与TCGA数据库表达一致的Hub基因进行ROC曲线分析,最后,利用Kaplan-Meier绘图仪在线工具对结直肠癌患者进行预后分析.结果 筛选出GSE211496数据集2 570个DEGs(p.adj<0.01且|log2FC|≥1),GSE6988 数据集 406 个 DEGs(p.adj<0.01 且 |log2FC|≥1)和 GSE29900 数据集 99 个差异表达miRNA(p.adj<0.01且|log2FC|≥1),预测出差异表达miRNAs的靶基因14 938个,将靶基因与DEGs重叠共获得30个目标基因.KEGG通路结果显示,目标基因主要富集于血管平滑肌收缩和矿物吸收通路.通过连接度从PPI网络中筛选出前10个Hub基因;Hub基因经TCGA数据库验证,发现MYL9、ACTG2、AGT和PDGFRA与GSE211496数据集表达一致.分析这4个Hub基因对结直肠癌的诊断情况发现,基因AGT(AUC=0.901,95%CI 0.868~0.933)与预测结直肠癌的发生呈正相关,基因 MYL9(AUC=0.820,95%CI 0.757~0.884)、ACTG2(AUC=0.855,95%CI 0.802~0.908)和 PDGFRA(AUC=0.815,95%CI 0.772~0.858)与预测结直肠癌的发生呈负相关.基因MYL9、ACTG2和PDGFRA对结直肠癌诊断均有一定准确性,基因AGT对结直肠癌诊断具有较高准确性.Kaplan-Meier生存分析发现,PDGFRA、ACTG2和 MYL9低表达均显示患者预后较好,差异均有统计学意义(P<0.05).结论 该研究通过生物信息学分析筛选并鉴定出4个基因是结直肠癌中的枢纽基因,这些基因包括PDGFRA、ACTG2、MYL9和AGT,这将为结直肠癌研究提供一些新方向.