摘要
牛亚科下的牛属物种包括普通牛、瘤牛、印度野牛、大额牛、爪哇牛、牦牛、欧洲野牛和美洲野牛,其品种繁多,分布于世界各地,且基因组中蕴含着丰富的遗传变异。结构变异(SV)作为基因组上多样性的重要来源,对基因组的影响远远大于单核苷酸多态性(SNP),更易引起基因组的扰动,从而影响基因的表达和表型的改变。近期的研究已经证明了使用多个个体的基因组构建的图形泛基因组可以捕获更多的遗传多样性并揭示基因组的复杂性。本研究基于16个已公布的三代测序的牛属基因组以及10个新组装的中国瘤牛三代测序基因组构建了牛属物种图形泛基因组,并对图形泛基因组捕获的变异进行全面的解析,最后基于图形泛基因组对 152 个家牛全基因组重测序样本进行SV的分型与解析,主要结果如下: 1、本研究利用 9头普通牛、12头瘤牛、2头家牦牛、1头印度野牛、1头美洲野牛和 1 头野牦牛的基因组构建了牛属物种图泛基因组,鉴定了在参考基因组未包含的288Mb的序列,其中大于 50bp的序列占了 172Mb。对非参考序列进行基因的从头预测,鉴定到了 1887个新基因,平均基因长度为 5.4Kb,平均编码区长度为 931bp,功能富集分析发现这些基因和正常生命活动和免疫相关。 2、图形泛基因组捕获了7150万个小的变异(lt;50 bp)以及216,958个SV,小变异绝大部分是以二等位存在,而 SV 是以多等位形式存在,代表了牛属物种基因组变异的多样性。图形泛基因组除了有解析复杂变异的优势,也可以捕获基于线性参考基因组比对方法的绝大部分SV。约有12.3万个SV注释到了转座元件的重复序列,其中大部分重复序列是由长散在重复序列主导。进一步对 SV 的基因功能注释发现只有2024个SV落在基因外显子区域,表明SV在编码区受到强烈的负选择,此外,SV更倾向于在富含重复序列的染色体的末端富集。 3、利用家牛群体的图形泛基因组对152个家牛的全基因组重测序样本进行SV分型,本研究获得了约 12 万个高质量的 SV。通过主成分分析、系统发育分析和Admixture分析,将这152个家牛划分为世界六大家牛群体。进一步对普通牛和瘤牛进行受选择分析,本研究发现了与瘤牛环境适应性可能相关的 DNAJC18 基因内含子缺失,与瘤牛免疫抗病相关的 IFIT3 基因上游插入变异,以及一系列与生长、生产和生殖等性状相关的基因的SV。 涵盖多个牛属物种的超级泛基因组解析了牛属物种遗传多样性,基于图形基因组应用为牛的基因组学研究以及育种方向提供了重要的参考。