摘要
中枢神经系统疾病是由中枢神经系统功能紊乱或结构损伤所引起,这些疾病分为许多类,比较典型的两大类是神经发育障碍疾病和神经退行性疾病,分别以自闭症谱系障碍(Autism Spectrum Disorder,ASD)和帕金森病(Parkinson''s Disease, PD)作为代表性疾病。 目前,单细胞 RNA 测序(Single-cell RNA Sequencing,scRNA-seq)已成为揭示单个细胞内RNA转录本的异质性以及高度组织化组织中不同细胞类型和功能的前沿方法。单核RNA测序(Single-nuclear RNA Sequencing,snRNA-seq)解决了scRNA-seq组织保存和细胞不易分离的相关问题,更适合脑组织、心脏等复杂组织的测序。然而,目前基于sc/snRNA-seq对ASD或PD的研究均集中在基因表达水平,并未考虑一个基因不同转录本的使用差异。 选择性多聚腺苷化(Alternative Polyadenylation,APA)是在同一基因上选择不同多聚腺苷化(Polyadenylation,poly(A))位点,产生不同长度 3''UTR 转录本的过程。APA 是真核生物转录多样化的广泛调控机制,已有多项研究证明,ASD 与 PD的发病与APA的异常有关。目前已有许多生物信息学方法(如Sierra、scAPAtrap等)能够从sc/snRNA-seq数据中识别单细胞水平的全基因组APA位点,为分析转录本表达的单细胞异质性提供了方法基础。然而,已有的 APA 方法均侧重于识别和定量APA位点或是基于表达水平分析APA转录本的差异使用,并未考虑基因间相互作用的调控网络。而了解基因的功能往往需要研究它们相互作用调控网络的结构, sc/snRNA-seq 的快速发展也为构建和分析基因调控网络提供了广泛的数据基础。因此,若能利用目前大量可获得的 ASD和 PD的 snRNA-seq数据,从 APA转录本水平以及调控网络层面进行分析,将能综合基因-基因调控关系以及 APA 转录本的使用差异来补充和增强传统的基因水平的差异表达分析,有望揭示比传统基因表达水平更高分辨率的疾病风险基因。 本课题利用大脑 snRNA-seq数据进行 ASD及 PD的 APA调控机制分析。首先从健康人脑及ASD与PD患病大脑的snRNA-seq数据中识别并定量单细胞水平全基因组 poly(A)位点,并量化每个基因在单细胞水平的 APA 位点使用率。基于统计检验每个细胞类型下每个基因在疾病(ASD/PD)与健康样本间的 APA 使用率差异,获得差异使用的APA(Differentially Used APA,DU-APA)。特别地,开发基于APA调控网络重建的差异调控 APA(Differentially Regulated APA,DR-APA)识别框架,集成偏最小二乘回归(Partial Least Squares Regression,PLSR)、流形对齐等方法识别疾病与健康细胞间的 DR-APA基因。DU-APA与 DR-APA分别代表了基于表达水平的和基于调控网络的健康和疾病样本间的差异APA基因。 在ASD中,共识别到1586个DU-APA基因以及112个DR-APA基因,分别有288个DU-APA基因和6个DR-APA基因被SFARI数据库收录为ASD风险基因,说明APA的调控过程可能与ASD的发病机制存在潜在联系。在1586个DU-APA基因中,有511个APA基因只在一种细胞类型中表现出差异。其中在DU-APA基因中筛选出了 93 个最显著的差异 APA 基因,通过基因组浏览图重点解释了 DDX5、HNRNPK、TWIST1、SNRPC、HNRNPLL 这五个显著 DU-APA 基因,这些基因与ASD和 APA密切相关,如基因 DDX5的敲除导致了广泛的 3''UTR末端加工失调,基因 TWIST1基因可通过 miR-214-PPAR-δ信号通路来影响线粒体的正常功能,最终导致 ASD 的发生。通过基因的 RUD 统计图分析得到了 SATB2、SCN2A、CCT4、SPTBN1、TSPYL4、ZNF587、ANAPC5、FDX2这八个细胞特异性DU-APA基因,其特异表达的细胞类型参与 ASD发生。另外在 DR-APA中,通过基因的 RUD统计图分析得到了AARSD1、SP3、SH3BP1这三个细胞特异性DR-APA基因。 在 PD中,共识别到 1619个 DU-APA基因以及 201个 DR-APA基因,其中在DU-APA基因中有4个基因已经确定为PD风险基因。在1619个DU-APA基因中,有544个APA基因只在一种细胞类型中表现出差异。其中在DU-APA基因中筛选出的 45 个最显著的差异 APA 基因,通过基因组浏览图重点解释了 ITM2B、TPT1、GABARAP、TNRC6A这四个显著DU-APA基因,这些基因与PD和APA密切相关,如TPT1核蛋白表现出特异性调控,这可能对PD的发病机制产生一定的影响。通过基因的 RUD 统计图分析得到了 DNAJA1、LSS、GABARAP、CSTB 这四个细胞特异性 DU-APA基因,其特异表达的细胞类型参与 PD发生。另外在 DR-APA中,通过基因的 RUD 统计图分析得到了 TMEMT1、POU2F2、SELL、PCDHB4 这四个细胞特异性DR-APA基因。 综上所述,本研究通过分析大脑snRNA-seq数据揭示了ASD与PD中有重要调控作用的 APA 基因,为了解 APA 在这两种不同类型的神经系统疾病发病过程中的分子调控作用提供了新的见解,也有助于帮助解析 ASD与 PD的病理生理机制、寻找潜在治疗靶点以及开发个性化治疗策略。