摘要
癌症作为一种严重威胁人类健康的疾病,不仅对患者本人的生命造成威胁,也给其家庭和社会带来了沉重的负担。癌症的发生发展过程是极其复杂的,其中异常可变剪接被认为是诱发癌症的主要原因之一。可变剪接是一种转录后加工的调控机制,能使同一基因产生不同的转录本和不同的蛋白质亚型,从而影响细胞功能和生理过程。相关研究表明,异常的可变剪接会引起癌症细胞的增殖和转移,并导致耐药现象的出现。因此,探究癌症中的可变剪接有助于理解癌症的发生发展机制,为癌症提供大量新的生物标志物,同时为癌症的治疗提供新的思路和方法。本研究围绕癌症组学数据展开,旨在通过生物信息学手段探索新的可变剪接调控因素,从而解析癌症中可变剪接的特征,并识别出新的源于可变剪接的癌症新生抗原,这对于癌症的精准治疗具有重要的指导意义。 为了揭示不同癌症类型的可变剪接特征,本研究整合了公共数据库中16种癌症类型共6904名患者的表达谱数据、可变剪接数据和临床信息数据,绘制了全面的泛癌可变剪接图谱。该图谱展示了各种癌症中可变剪接事件的类型、频率和分布情况,并显示不同癌症可变剪接模式间的高度异质性。此外,可变剪接与癌症患者的生存率密切相关,相同的可变剪接事件对不同种类的癌症可能存在完全相反的影响。这些结果表明可变剪接及其产生的影响在癌症的诊疗及预后中发挥着不容忽视的作用。 作为可变剪接的执行者,剪接因子的异常能够引起大量靶基因的剪接或表达出现异常。本研究通过剪接因子motif富集、蛋白质互作、分子动力学模拟及剪接异构体验证等方法对16种癌症中167个剪接因子的可变剪接及表达量数据进行了全面的分析,结果表明在癌症组织中剪接因子不仅会出现异常表达,本身也会发生异常可变剪接,且剪接因子异常剪接的数量远多于异常表达的数量。剪接因子的异常剪接会触发一系列可变剪接的变化,破坏正常细胞中已形成的蛋白互作网络,使细胞出现基因表达、蛋白质翻译、信号传导和代谢等过程的异常,并影响癌症的可变剪接模式。 异质性是癌症的明显特征,这也是癌症精准医疗所需面对的难题。本研究以肺癌单细胞数据为基础,提出了一种多平台单细胞测序数据整合的可变剪接分析方法;在此基础上,构建了肺癌单细胞可变剪接图谱,通过对正常、早期肺癌、晚期肺癌上皮细胞中可变剪接的异质性分析,揭示了肺上皮细胞向恶性转化中的潜在分子机制,并在早期及晚期肺癌中分别识别出20个和57个潜在的源于可变剪接的CAR-T免疫治疗靶点。 现阶段免疫治疗已成为最具发展潜力的癌症治疗方法,然而,特异性抗原靶点的缺乏限制了其广泛应用。研究表明,源于可变剪接的新生抗原在很大程度上代表了一类尚未开发的免疫治疗靶点。本研究开发了一种源于可变剪接的癌症新生抗原识别方法,并构建了源于可变剪接的癌症新生抗原数据库—ASPNs。此外,在该新生抗原识别方法的基础上,本研究在单细胞水平上分别在早期与晚期肺癌患者中识别出一系列源于可变剪接的癌症新生抗原,为肺癌免疫干预策略的研发提供了潜在的靶点。 综上所述,本研究利用癌症组学数据进行了泛癌可变剪接分析,绘制了泛癌可变剪接图谱,揭示了剪接因子异常剪接对可变剪接的调控机制;提出一种多平台单细胞测序数据整合的可变剪接分析方法,在单细胞水平上深入探究了肺癌细胞的可变剪接异质性;提出一种源于可变剪接的癌症新生抗原识别方法,识别出一系列源于可变剪接的癌症免疫治疗靶点。以上结果加深了对癌症可变剪接机制的理解,为癌症免疫治疗提供了新的思路和方向。