摘要
目的 探讨基于公共数据库构建甲状腺癌差异基因Cox比例风险回归模型对患者预后评估价值.方法 对GEO数据库中甲状腺癌数据集GSE138198和GSE50901进行批次校正,联合TCGA数据库,筛选甲状腺癌样本中发生改变的基因.利用R软件将TCGA数据库中甲状腺癌患者随机分为试验组和验证组,在试验组中建立Cox比例风险回归模型,采用Kaplan-meier生存曲线分别在试验组、验证组和整体组(TCGA数据整体)中分析高和低风险组生存状态,采用受试者工作特征(ROC)曲线评估模型预测甲状腺癌患者生存率准确性.分析甲状腺癌高和低风险组差异基因并进行GO和KEGG功能富集分析.采用单因素和多因素Cox回归分析探讨甲状腺癌患者临床病理特征与预后关系.结果 单因素Cox回归分析显示,57个差异基因与甲状腺癌患者预后相关(P<0.05).经LASSO回归分析和多因素Cox回归分析确定PHLDA2、GPR137 B、PORCN、MAPK4和TSPYL2共5个基因参与模型构建.在试验组、验证组和整体组中,高风险组生存时间和生存率低于低风险组.高和低风险组差异基因GO功能富集分析发现,受体介导的内吞作用和先天免疫应答激活信号传导等显著富集;KEGG功能富集分析发现,mTOR信号通路、甲状腺激素信号通路和HIF1信号通路等显著富集.多因素Cox回归分析显示,甲状腺癌患者年龄和风险值评分与预后相关(P<0.05或P<0.01).结论 通过GEO和TCGA数据库构建的基于5个差异基因的甲状腺癌Cox比例风险回归模型,具有较高的准确性和可靠性,有助于临床医生判断甲状腺癌患者预后.