摘要
理解物种形成过程中导致基因组变异的进化机制一直都是群体遗传学和进化生物学研究的核心目标。麻栎、栓皮栎和小叶栎共同构成了中国栎属麻栎组。这三个物种的大部分群体是同域分布的,但在形态上有明显的区别。他们与同域分布的其它栎属物种间存在很大的分化,不存在基因流。因此,这三个物种是研究近缘种物种分化、基因组变异模式及适应性进化的理想材料。本研究利用群体基因组学的研究方法,从多个角度剖析了中国栎属麻栎组物种的基因组变异模式及其驱动机制,主要的研究结果和结论如下: 1、为了全面厘清麻栎、栓皮栎和小叶栎的群体结构和分化历史,本研究通过101个全基因组重测序数据及基于此获得的16,654,671个高质量SNP位点,联合运用多个群体结构和进化历史分析方法,发现麻栎、栓皮栎和小叶栎三个物种之间存在着显著的遗传分化;三个近缘种间的分化发生于新近纪,并于更新世经历了群体的收缩与扩张;相较于最先从共同祖先中分化出来的小叶栎来说,麻栎和栓皮栎的遗传多样性更高,亲缘关系更近,基因流也更频繁。 2、为了阐明这三个近缘种的种间基因组分化模式及其驱动机制,本研究基于多个群体遗传学参数的联合分析,发现种间多个群体遗传学参数(如重组率、核苷酸多样性、Tajimas''sD和Fay and Wu''s H)高度正相关,种间的基因组变异模式类似,都是异质性分布的,存在着许多短且分散的高分化基因组岛屿区域。共祖模拟证实了这些岛屿区域的形成不是遗传漂变和群体历史导致的。进一步对岛屿区域与基因组其它区域进行比较,我们发现岛屿区域通常具有更高的相对分化指数(FST)及富集分数(ECH),较低的绝对分化(RND)、重组率及最近共祖半衰期相对时间(RTH’)。此外,我们还在岛屿区域内检测到显著的正选择信号,包括降低的遗传多样性,富集的低频率等位基因和高频率衍生等位基因。这些结果说明选择性清除是导致中国栎属麻栎组物种种间高分化基因组岛屿形成的主要原因。 3、为了解析不同的连锁选择模式对种内基因组变异模式产生的影响及其相对重要性,本研究利用PloyDFE对种内基因组上的各类位点了进行正、负选择的量化计算,结果发现麻栎、栓皮栎和小叶栎分别有37.5%、37.3%和26.1%的非同义突变位点受到强烈负选择的作用(Ns <-100),而基因组上固定的非同义突变位点中,44%、36%和19%的固定位点是由于正选择作用而被固定下来的,说明正、负选择在种内基因组的编码区广泛存在。进一步对非同义替换位点和同义替换位点周围的核苷酸多样性进行比较,我们发现选择性清除降低了固定的有利变异位点周围的遗传变异。此外,通过对基因区和非基因区的多态性进行比较,我们发现背景选择了降低基因区域的遗传变异。最后,通过计算两种选择模型下预期的核苷酸多态性,发现仅考虑背景选择的模型在500 kb窗口内的预期多态性和实际观察多态性之间的相关性在麻栎、栓皮栎和小叶栎中分别为0.59、0.53和0.42。在同时考虑背景选择和选择性清除影响的模型中,预期和实际多态性之间的相关性与只考虑背景选择的模型相比没有明显差异,这些结果说明背景选择决定了麻栎组物种种内基因组的背景变异模式。 4、为了更准确地探索中国栎属麻栎组物种的适应性进化机制,本研究基于二代和三代测序数据以及转录组数据,组装并注释了一个806Mb的高质量栓皮栎基因组,同时收集了栓皮栎29个群体共143个个体的全基因组重测序数据,最终共获得26,319,873个高质量SNP位点。群体结构分析发现栓皮栎物种内部存在着微弱的群体结构,可分成东西两组。进一步通过PCAdapt和LFMM对栓皮栎群体进行全基因组扫描,找到了1661个与局部适应极显著相关的SNP位点,其中99.59%都聚集在5号染色体约270kb的区域上。此外,我们不仅在这个区域内检测到了强烈的正选择信号,基因功能注释结果显示该区域还存在着多个与抗逆境胁迫有关的基因。最后,本研究利用多种基因流的检测方法对这一270kb适应性候选区域的来源进行追溯,证实了栓皮栎西部群体的这个区域极有可能来源于与其同域分布的麻栎西部群体,而VocalnoFinder的结果也进一步验证了该区域确实具有强烈的适应性渐渗信号。 本研究基于全基因组重测序数据,分别在种间、种内以及群体水平上解析了中国栎属麻栎组物种的基因组变异及其驱动机制,为我们理解遗传多样性产生和维持的机制奠定了基础。