首页|早发性和晚发性非小细胞肺癌差异基因的鉴定及预后风险模型的构建

早发性和晚发性非小细胞肺癌差异基因的鉴定及预后风险模型的构建

刘磊

早发性和晚发性非小细胞肺癌差异基因的鉴定及预后风险模型的构建

刘磊1
扫码查看

作者信息

  • 1. 大连医科大学
  • 折叠

摘要

目的:非小细胞肺癌(non-small cell lung cancer,NSCLC)是肺癌中最常见的类型,其发病率随着年龄的增长而增加。年龄是NSCLC发生的重要危险因素之一,但目前不同年龄段NSCLC的发生机制尚不清楚。本研究旨在通过剪刀(Scissor)算法鉴定出早发性和晚发性非小细胞肺癌的差异基因并构建预后风险模型来进一步研究模型与非小细胞肺癌的预后和免疫治疗反应的关系。 方法:1、从UCSC Xena数据库中下载肺腺癌(Lung adenocarcinoma,LUAD)和肺鳞状细胞癌(lung squamous cell carcinoma,LUSC)的转录组表达数据及相应的临床数据,排除生存信息不完整的样本后构建了LUAD和LUSC的年龄相关表型。在这个表型中,年龄≤50岁被定义为早发肿瘤,年龄>50岁被定义为晚发肿瘤。从基因表达综合数据库(Gene Expression Omnibus,GEO)下载LUAD和LUSC的单细胞RNA测序(single-cell RNA sequencing,scRNA-seq)数据。随后,LUAD和LUSC的年龄相关表型,Bulk-RNA数据和scRNA-seq数据作为Scissor算法的输入文件用于在LUAD和LUSC的scRNA-seq数据中鉴定出与年龄相关的单细胞亚群,并对鉴定出的亚群进行差异分析。随后,对鉴定出的差异基因进行富集分析以探索其生物学功能。2、基于非负矩阵分解(non-negative matrix factorization,NMF)算法,对鉴定出的差异基因进一步行聚类分析,并探索不同聚类亚型在预后,免疫微环境及生物学功能上的差异。3、单因素Cox回归分析和最小绝对收缩和选择算子(the least absolute shrinkage and selection operator,LASSO)分析被用于进一步筛选差异基因,并使用基因集变异分析(Gene Set Variation Analysis,GSVA)算法构建年龄相关预后模型,命名为年龄相关评分(age-related score,ARscore)。基于ARscore的中位值,在TCGA队列和3个GEO队列中划分高低风险组。生存分析被用于探究高ARscore组与低ARscore组的预后差异。多因素Cox回归分析被用于分析ARscore与临床特征间的联系。4、使用GSVA算法进一步在scRNA-seq数据集中构建了ARscore用于探究高低ARscore组的生物学差异。5、使用利用表达数据估算恶性肿瘤中的基质细胞和免疫细胞(The Estimation of Stromal and Immune Cells in Malignant Tumors Using the Expression Data,ESTIMATE)算法和单样本基因集富集分析(single-sample gene-set enrichment analysis,ssGSEA)算法进一步评估高低ARscore组在肿瘤免疫微环境的差异。6、Wilcoxon检验用于评估ARscore与免疫治疗间的关系。 结果:1、通过Scissor算法在LUAD和LUSC的scRNA-seq数据集中分别筛选出2个与年龄相关的单细胞亚群。随后,差异分析表明,共有85个基因在2个与年龄相关的单细胞亚群中具有显著差异。富集分析表明,差异基因主要与细胞外进程、免疫、炎症、凋亡和肿瘤的进展相关。2、基于NMF算法聚类出2类分子亚型(C1和C2)。与C2组相比,C1组有更好的生存优势(P=0.042)和更深的免疫浸润丰度。富集分析表明,C1组主要与自身免疫性疾病、代谢、炎症及癌症通路相关,C2组主要与细胞周期、细胞代谢及致癌靶点相关。3、在TCGA队列及3个GEO队列中,与低ARscore组相比,高ARscore组有更差的预后(P<0.05)。多因素Cox回归分析表明,ARscore是独立预后因素(P<0.05)。4、在单细胞数据集中,高低ARscore组的差异基因主要富集在细胞的转录、翻译和修饰、细胞外运输、自身免疫、神经退行性病变及细胞清除功能等通路上。5、在肿瘤免疫微环境中,相较于低ARscore组,高ARscore组有更高的免疫评分,基质评分和总体评分,并且大量免疫细胞显著富集在高ARscore组中。6、6种常见的免疫检查点基因在高ARscore组有更高的表达,且高ARscore组在接受PD-1治疗、CTLA-4治疗及PD-1和CTLA-4联合治疗时比低ARscore组有更好的治疗效果。 结论:基于Scissor算法,我们构建了一个与年龄相关的风险预后模型,并且该模型可作为一种新的方法用于预测NSCLC的预后和免疫治疗反应。

关键词

非小细胞肺癌/差异基因鉴定/免疫治疗/预后风险/差异基因

引用本文复制引用

授予学位

硕士

学科专业

外科学

导师

史加海

学位年度

2023

学位授予单位

大连医科大学

语种

中文

中图分类号

R73
段落导航相关论文