首页|基于TCGA数据库构建乳腺癌免疫基因预后风险模型

基于TCGA数据库构建乳腺癌免疫基因预后风险模型

徐向楠

基于TCGA数据库构建乳腺癌免疫基因预后风险模型

徐向楠1
扫码查看

作者信息

  • 1. 大连医科大学
  • 折叠

摘要

目的:乳腺癌的诊治初步进入了免疫治疗时代,本文基于TCGA数据库构建预测乳腺癌预后的免疫基因预后风险模型,分析乳腺癌的免疫基因相关预后特征与临床病理学及生物学特点之间的相关性,为临床乳腺癌预测预后及诊治提供思路。 方法:在肿瘤基因组图谱计划(TheCancerGenomeAtlas,TCGA)官方网站上直接下载TCGA-BRCA的基因表达数据和完整的临床数据,利用Perl程序语言提取相应的表达矩阵,采用差异表达基因(DEGs)分析和单因素Cox回归分析确定与总生存(OS)相关的DEGs。进行Lasso回归和多因素Cox回归分析构建免疫相关的预后模型,按照模型公式计算得出每一个样本的风险等级。根据中位风险等级评分将患者划分为高、低两个风险类型组,比较二者之间的生存差异,时间依赖的ROC曲线用于评估该预后模型在5年生存期的预测能力。应用Cox回归模型,分析临床病理因素及预后风险模型中影响乳腺癌患者生存的主要因素。同时Cox回归分析也可以被用来确定乳腺癌的独立预后影响因素。此外,我们还研究了免疫相关特征和临床特征与免疫细胞浸润之间的相关性。最后,在一个外部独立的数据集中对预后风险模型进行验证。 结果:从TCGA数据库共计获得1222例乳腺癌样本的转录组数据,同时整合得到1085例女性乳腺癌患者的临床数据。通过差异性分析,共甄别得到差异性表达的免疫基因366个,其中表达上调的免疫基因193个,表达下调的免疫基因173个。将差异性表达的基因进行单因素Cox回归分析,结果表明,IGHE、ULBP2、ADM、SEMA6D等59个免疫基因与患乳腺癌的人群预后密切相关。为了探索这些基因的调节机制,在此,我们构建了一个TF介导的调控网络。对59个免疫基因进行LassoCox回归分析,根据Lambda值,35个基因被过滤,结合多因素Cox分析,最终筛选出13个免疫相关基因(ULBP2、HLA-G、CXCL13、TINAGL1、NFKBIE、IGHE、SEMA3F、SEMA6D、CLEC11A、FGF7、TSLP、FLT3、TRBJ2)构建出乳腺癌的免疫相关预后模型。根据中位数1.32,844例生存时间≥90天的女性乳腺癌患者被划分为高风险组(422例)和低风险组(422例)。生存分析显示,总体生存率在低风险评分患者中明显更高(P=1.332e?15)。临床特征相关性分析显示,CXCL13、FLT3、NFKBIE、SEMA3F、TINAGL1、TRBJ2-7、TSLP在不同年龄、不同病理分期、不同TNM分期的表达均有显著差异。风险评分与免疫细胞浸润相关性分析提示,高风险组中CD4+T细胞浸润密度明显降低。最后,在ICGC数据库中进一步成功验证了该免疫相关预后模型的预后价值,其5年AUC达到0.823。 结论:免疫相关基因的预后特征能够很好地预测乳腺癌患者的预后,结合乳腺癌患者的临床病理特征,可筛选出高风险群体,为其提出一种个性化的临床诊疗方案。

关键词

乳腺癌/TCGA/免疫基因/生物信息学

引用本文复制引用

授予学位

硕士

学科专业

外科学

导师

符德元

学位年度

2021

学位授予单位

大连医科大学

语种

中文

中图分类号

R73
段落导航相关论文