摘要
目的: 大鼠是研究脊髓损伤(Spinalcordinjury,SCI)的重要动物模型,理解脊髓发育过程中的基因表达模式及其调控网络,对脊髓损伤和促进再生修复的相关研究具有重要的科学意义。目前对于跨越胚胎到成年的脊髓发育过程中的分子过程及其调控模式尚缺乏长时程的系统研究。本次研究通过对胚胎到成年的12个时间点的大鼠脊髓组织进行转录组测序,基于系统生物学思维并采用生物信息学关联分析分析的方法及实验验证,系统地研究脊髓发育过程中基因表达的时序模式及其分子调控网络的特征,为脊髓损伤和促进其再生修复提供更全面的基础数据和新角度的理论认知。 方法: 1.大鼠脊髓组织样本采集。本研究选用的SpragueDawley(SD)大鼠由南通大学实验动物中心提供。采集从大鼠胚胎期孕9天(E9d)开始,到大鼠性成熟后一个月(P12w)共计12个时间点(E9d、E11d、E14d、E18d、P1d、P3d、P1w、P2w、P3w、P4w、P8w、P12w)的脊髓组织样本。每个时间点设置3个生物学重复,一共采集36个脊髓组织样本。 2.大鼠脊髓组织的RNA质检和RNA-seq及miRNA-seq。利用TRIzol试剂盒提取各样本中的总RNA,用Agilent2100检测样本的RNA浓度、RNA完整值和28S/18S比值进行分析,过滤掉不合格的样本;分别按RNA-seq和miRNA-seq建库方法建库测序后,对测序数据进行质控:包括碱基组成、质量值分布和与参考基因组的比对率进行综合评估,经质控和过滤后,得到高质量的转录组测序原始数据。 3.基因表达定量及测序结果实验验证。利用生物信息学分析软件,对基因进行比对和表达定量。为了验证转录组数据的可靠性,我们随机选择了两个持家基因和两个miRNA(Dnmt3a、Neurod4、miR-29c-3p和miR-18a-3p),并使用实时荧光定量聚合酶链反应实验(Quantitativereal-timePCR,qRT-PCR)和免疫荧光实验(Immunofluorescence,IF)进行验证。进一步地,我们还将免疫荧光实验数据与AllenBrainAtlas(ABA)数据库中近缘物种小鼠的脊髓原位杂交(ISH)数据进行了一致性比较。 4.大鼠脊髓发育的时间模式和分子网络特征分析。通过对时序转录组获得的15646个mRNA进行加权共表达基因网络分析(Weightedgeneco-expressionnetworkanalysis,WGCNA);计算τ特异性指数(Tauspecificityscore),筛选脊髓发育过程中阶段特异性表达基因(Stage-specificexpressedgenes,SSEGs),并进行功能富集分析;对脊髓组织发育过程中表达的miRNA与转录调控因子(Transcriptionfactors,TFs)表达模式的结合分析;采用SCENIC软件推断转录因子及其相关调控基因组成的调控子(Regulon)在大鼠脊髓发育过程中的活性;对差异表达基因在不同发育时期的数量和表达模式的整体分析;采用rMATS软件进行差异可变剪切分析,并对其中具有新的剪接特征的基因进行了表达聚类分析;分别对脊髓组织中的免疫系统发育相关基因、表观遗传修饰关键基因和G-proteincoupledreceptor(GPCR)进行表达模式聚类分析。 5.通过多数据库预测转录因子结合位点、双荧光素酶报告基因实验(Dualluciferasereporterassay)、PCR实验和免疫荧光实验,初步筛选并验证潜在的调控重要发育因子EGFR的转录因子。 结果: 1.本研究获得15646个有表达的编码基因和667个有表达的miRNA。差异表达分析显示E11d与E14d两个时间点之间有多达2438个差异表达基因(其中三分之二上调,其余下调),其数量不仅占到大鼠全部编码基因的约10%,而且是其他任何时间点差异基因数量的约10倍,并且脊髓组织中差异表达的lncRNAs与脊髓组织中差异表达基因的数量变化趋势高度一致。通过分析该时期差异表达基因的上游因子,发现该事件可能与上游调控网络引发的大规模染色质重塑和谱系激活有关,进而启动了神经管向脊髓快速而精细的发育过程。 2.基于转录组数据对大鼠脊髓组织发育阶段进行了较为精确的划分。对15646个已知的编码基因进行了WGCNA分析,一共获得了21个共表达模块。对基因模块按发育时间轴划分为4个主要阶段,依次为胚胎脊髓形成阶段(E9d-E14d)、神经元分化和突触形成阶段(E14d-P1w)、胚后发育阶段(P1w-P8w)和发育成熟阶段(P8w-P12w),并且各个阶段相应模块的功能富集与实验观察一致:发育早期有参与脊索胚胎发育、转录正调控的M6模块和参与神经元细胞命运决定的M14模块;发育中期有参与轴突发育的M10模块和参与神经营养发育的M5和M2模块;发育中后期有参与髓鞘化的M3模块和性成熟前后参与先天免疫正调控的M7模块。 3.大鼠胚胎期到新生期(E9d-P1w)脊髓组织发育过程中SSEGs的数量逐渐减少。其中E9d时特异表达基因数量最多,主要富集于细胞增殖、胚胎发育、图式形成等相关功能;E11d时特异表达基因的数量明显减少,主要富集于图式发育、转录调控、基因表达、细胞命运决定等相关功能;E14d时特异表达基因的数量进一步减少,其功能主要涉及离子转运、电压门控离子通道等。 4.大鼠脊髓发育过程中转录因子(TFs)的表达以新生期(P3d)为界线,可划分为2个不同的表达模式:P3d前高表达的TFs功能富集于干细胞的命运决定和功能调控、神经发育;P3d后高表达的TFs功能富集于分化与先天免疫激活。转录调控子网络的活性在不同发育阶段不同,并且与相应发育阶段的生物学功能相适应,如许多参与昼夜节律调控的转录调控子在出生以后更为活跃。大鼠脊髓组织发育过程中表达的已知miRNA主要与细胞增殖相关,并且miRNA的表达模式在新生期(P3d)前后呈现不同的趋势。脊髓发育不同阶段能量代谢的主要途径有所不同,表现为与糖原合成相关的基因在E9d到P3d时表达较高、与氧化磷酸化相关的基因在P1w到P12w时表达较高。 5.发育过程中的可变剪接具有阶段特征,外显子跳跃是脊髓发育过程中最主要的可变剪接形式;差异可变剪接事件主要集中在E11d到E14d以及新生期,其中部分可变剪接事件可能与郎飞结的发育相关。对转录组中具有新可变剪接特征的基因进行WGCNA分析,获得了27个模块,按模块活跃的时间和主要生物学功能进行分析发现:不仅具有新可变剪接特征的基因有着与神经系统发育过程相匹配的功能富集,它们主要的生物学功能从早期的干细胞维持逐渐过渡到促进细胞分化与维持组织内稳态,同时也为大鼠脊髓发育研究提供了新的基因亚型数据资源。 6.大鼠脊髓组织发育过程中的表观遗传修饰相关基因表达变化明显。如CpH甲基化关键基因Dnmat3a从胚胎到新生期高表达;参与m6A甲基化修饰的Writer和Eraser相关基因在脊髓发育早期表达较高,且总体表达是一个随着发育而逐渐降低的趋势;以TETs家族为代表的DNA主动去甲基化相关基因在新生期前后表达较高。 7.大鼠的脊髓转录组中有883个表达的G蛋白偶联受体(GProtein-coupledReceptor,GPCR)基因。它们的表达模式以新生期(P1d)前后为界可以分为两类。作为GPCR中的一个大家族,嗅觉受体(Olfactoryreceptors,ORs)基因的表达模式呈现时间点特异性,并且新生期(P1d)表达的嗅觉受体基因数量最多。 8.整合不同数据库交叉预测了调控重要发育基因Egfr表达的9个候选转录因子。双荧光素酶报告基因实验显示,其中6个转录因子(Foxa2、Sox17、Bhlha15、Ddit3、Klf1和Stat3)表现出Egfr报告基因转录活性的改变。其中,Foxa2表现出显著增加Egfr报告基因表达的活性,且PCR和免疫组化实验结果也证实Foxa2主要在胚胎期高表达并随后迅速降低。这些结果提示Foxa2可能通过结合Egfr启动子区的顺式作用元件来调控它在脊髓胚胎期的表达。 结论: 1.首次描绘了脊髓自胚胎到成年发育过程中编码基因和非编码RNA长时程表达图谱,为脊髓发育和损伤修复基础研究提供了重要的数据资源。 2.基于长时程的基因表达图谱,将脊髓发育过程划分为4个主要发育阶段;并整合多组学数据(mRNA、lncRNA和miRNA),结合生物信息学分析,从不同的层面,系统全面地阐述了脊髓发育过程中时间相关模式的阶段性特征。比如:发育早期的差异表达基因的数量波动、以新生期为界限的TFs-miRNA镶嵌模型、可变剪接事件的时间分布模式、表观遗传调控的阶段特异性、GPCRs超家族表达模式的阶段性等。同时,我们也对脊髓发育过程中的不同功能的分子网络进行了系统的研究。比如;不同发育阶段的基因共表达网络、以小胶质细胞为代表的免疫系统发育网络、出生后参与昼夜节律调控的转录调控子网络、氧化磷酸化为主的能量代谢网络等。我们的研究对脊髓发育和以脊髓损伤为代表的中枢神经系统的损伤和再生领域的发展提供了更全面的数据资源和新角度的认知。 3.初步筛选并验证了Foxa2作为Egfr基因上游的潜在调控因子。