摘要
背景:胆管癌(CCA)的发病率和死亡率在全球范围内呈上升趋势。由于早期症状不明显,大多数患者诊断时已为晚期,预后较差。本研究旨在通过整合mRNAs和lncRNAs的转录组信息建立CCA的预后预测模型,以期提高对CCA患者的预后预测能力。 方法:从癌症基因组图谱数据库(TCGA)收集了45个样本作为训练集,从基因表达综合数据库(GEO)收集了57个样本作为验证集(GSE107943)。通过单变量和多变量Cox回归分析建立mRNA-lncRNA风险评分模型。时间依赖性ROC曲线评估mRNA-lncRNA信号的预后预测能力。此外,对风险模型与不同临床特征进行相关性分析,并通过基因集富集分析(GSEA)研究mRNA-lncRNA信号的潜在生物学功能。最后通过加权基因共表达网络分析(WGCNA)找出与mRNA-lncRNA信号密切相关的基因。 结果:通过单变量和多变量Cox分析,鉴定出2个mRNAs(CFHR3、TROAP)和2个lncRNAs(AC007285.1、AC134682.1)构成本研究的分子预后模型。ROC曲线表明mRNA-lncRNA信号具有较高的预后特异性和敏感性,在1年和3年生存预测的ROC曲线下面积(AUC)分别为0.813和0.731。随后,在GSE107943数据集和整合数据集中验证了该分子预后信号,预测3年生存的AUC分别达到0.735和0.746。该分子信号的预后能力不仅独立于临床因素(HR=12.60,P=1.51E-02),而且作为预后标志物的预后表现优于临床因素(预测3年生存率时AUC=0.746)。GSEA方法表明在高风险组高表达的基因显著富集于补体及凝血级联反应、PPAR信号通路、生物大分子合成及代谢相关通路,提示这些通路与CCA的肿瘤形成相关。WGCNA筛选到与mRNA-lncRNA信号密切相关的13个核心基因。 结论:本研究基于CCA的mRNA和lncRNA转录组数据构建了一个CCA的预后预测模型。该模型能识别具有预后不良的高风险患者,并可作为胆管癌患者预后的独立预测因子。