摘要
目的:乳腺癌是世界范围内最常见的恶性肿瘤,也是女性健康的“头号杀手”。根据激素受体表达水平,临床上将乳腺癌分为四种亚型:管腔A型、管腔B型、人类表皮生长因子受体2(Human epidermal growth factor receptor2,HER2)过表达型以及三阴性乳腺癌(Triple-negative breast cancer,TNBC)。其中,TNBC占所有乳腺癌患者的12-18%,其分子特征为雌激素受体(Estrogenreceptor,ER),孕激素受体(Progesterone receptor,PR)和HER2受体表达均为阴性。与其他类型乳腺癌相比,TNBC在生物学行为上具有较强的侵袭性,由于肿瘤进展较快,易复发转移,预后不佳而备受瞩目。目前,TNBC仍缺乏有效的治疗手段,以及化疗耐药性等问题仍急需解决。因此,探究TNBC发病机制并提供新的治疗策略十分必要。 随着近年来生物技术的迅速发展,越来越多的证据表明,长链非编码RNA(Long non-coding RNA,lncRNA)在乳腺癌等肿瘤发生发展中具有重要作用。LncRNA是一类长度大于二百个核苷酸的转录片段,在细胞核或细胞质中存在,不能编码蛋白,却发挥促癌或抑癌的功能,调节肿瘤的转移侵袭,细胞凋亡和耐药等过程。LncRNA通过表观遗传调控和翻译后蛋白活性调节等多种机制影响基因功能,且具有更高的特异性,表明其更适合作为癌症诊治的分子靶标。因此,本研究基于癌症基因组图谱(The cancer genome atlas,TCGA)的RNA测序(RNA sequencing,RNA-seq)数据库,结合加权基因共表达网络分析(Weighted gene co-expression network analysis,WGCNA)等多种生物信息学方法,筛选并鉴定影响TNBC的lncRNA相关基因调控网络,揭示其在TNBC发生发展和预后不良过程中的复杂分子机制,为寻找TNBC最佳治疗策略和预防手段提供依据。 方法:第一部分:(1)通过edgeR软件包分析TCGA数据库中TNBC临床早期和晚期癌组织与乳腺正常组织RNA-seq数据;利用差异基因表达谱进行WGCNA分析得到显著的基因聚集模块。(2)利用注释可视化与集成发现数据库(Database for annotation visualization and integrated discovery,DAVID)软件的GO插件和Cytoscape的KEGG插件对模块内基因进行功能注释和通路富集分析,探索基因显著参与的生物学过程。(3)对最显著模块中的共表达基因簇进一步进行生存分析,筛选出影响TNBC预后的lncRNA LINC00466。(4)利用survival、nomogram软件包进行TNBC预后分析和列线图模型构建,识别LINC00466对TNBC不良预后预测的能力。(5)利用基因集富集分析(Gene set enrichment analysis,GSEA)分析,根据LINC00466表达水平进行功能富集。(6)利用定量PCR验证TNBC组织中LINC00466表达。(7)慢病毒构建LINC00466稳定敲减细胞系,检测细胞增殖(平板克隆、CCK-8和EdU实验)和细胞周期(流式细胞术),通过裸鼠成瘤实验观察肿瘤生长。 第二部分:(1)利用转录因子预测、基因蛋白互作等生物信息学手段,预测LINC00466可能通过结合SRSF3蛋白发挥生物学作用,并构建相关基因调控网络。(2)慢病毒构建稳定过表达LINC00466细胞系,并在在过表达LINC00466基础上敲减SRSF3,定量PCR及Western blot检测SRSF3的靶蛋白FOXM1及其下游分子表达水平。(3)通过RNA免疫沉淀(RNA immunoprecipitation,RIP)和RNA pull down实验验证LINC00466与SRSF3蛋白结合。(4)利用过表达LINC00466的细胞系,检测细胞增殖(平板克隆、CCK-8和EdU实验)和细胞周期(流式细胞术),通过裸鼠成瘤实验观察肿瘤生长。(5)生物信息学预测与SRSF3及LINC00466存在潜在结合位点的微小RNA(microRNA,miRNA),利用双荧光素酶报告基因检测系统进行验证。(6)慢病毒构建稳定敲减LINC00466的细胞系,给予miRNA抑制剂刺激,检测细胞增殖和细胞周期变化,裸鼠成瘤实验观察肿瘤生长。 结果:第一部分:(1)选取TCGA数据库中79例人TNBC组织样本数据,包括63例早期(ⅠA~ⅡB期)、16例局部晚期及晚期(ⅢA~Ⅳ期)及139例正常乳腺样本进行交叉比对,结果显示早期TNBC组与对照组之间有2136个差异基因,局部晚期及晚期TNBC组与对照组之间有2141个差异基因。(2)对早期组和局部晚期及晚期组中的差异基因,利用WGCNA包分析分别鉴定出7个和10个共表达模块与TNBC临床特征相关,其中早期组蓝色和局部晚期及晚期组的蓝绿色模块与TNBC肿瘤恶性特征显著相关。(3)GO功能和KEGG通路富集分析显示显著模块内共表达基因簇的生物学过程、生物学功能、细胞学组分和信号通路富集在细胞周期和微管运动。(4)利用Cytoscape软件对显著模块中前五十个基因进行关键节点分析,发现早期组显著模块中最关键的基因是KIF4A,KIF20A,NUSAP1,BUB1,CCNB1和CDCA8,局部晚期及晚期组显著模块中最关键的基因是TPX2,BUBIB,CDCA5,KIF2C和DLGAP5。(5)对局部晚期及晚期组显著模块中的基因进行生存分析,结果显示,有141个高表达的枢纽基因与不良预后显著相关,其中的lncRNA LINC00466与模块中多个核心基因存在联系。(6)列线图显示LINC00466表达对TNBC患者1年、3年和5年生存率都具有良好的独立预测能力,表明LINC00466高表达可以作为TNBC不良预后的独立预测因素。(7)GSEA分析结果显示LINC00466高表达与细胞周期功能显著相关。(8)通过定量PCR检测LINC00466在TNBC组织中高表达,且敲减LINC00466抑制TNBC细胞增殖和肿瘤生长,并导致细胞周期阻滞在G2/M期。 第二部分:(1)利用组织中基因表达的相关性和转录因子靶结合位点预测构建以FOXM1为转录因子,CCNB1、CDCA5、CDCA8为靶基因的LINC00466相关基因调控网络。(2)CatRAPID软件预测LINC00466与FOXM1的上游调控因子SRSF3具有较高的互作值并包含识别基序。(3)过表达LINC00466增加FOXM1及其下游CCNB1,CDCA5和CDCA8基因表达。(4)敲减SRSF3可抑制过表达LINC00466细胞中FOXM1及其下游靶基因表达。(5)RIP和RNApull down结果显示LINC00466可与SRSF3蛋白结合。(6)敲减SRSF3可抑制过表达LINC00466的TNBC细胞增殖和肿瘤生长,并导致细胞周期阻滞在G2/M期。(7)生物信息学方法筛选出与LINC00466及SRSF3mRNA结合的miRNA:miR-29c-3p、miR-29b-3p和miR-802。(8)给予miR-29c-3p、miR-29b-3p和miR-802抑制剂可恢复敲减LINC00466对TNBC细胞增殖和肿瘤生长的抑制作用以及细胞周期G2/M期阻滞。 结论:1、长链非编码RNALINC00466表达可作为TNBC不良预后的独立预测因素,其在TNBC组织中高表达且促进TNBC细胞增殖和肿瘤生长。2、LINC00466表达异常与细胞周期失调相关,LINC00466通过直接结合SRSF3或竞争性抑制机制上调转录因子FOXM1及其下游靶基因表达扰乱TNBC细胞周期,促进TNBC细胞恶性进展。