摘要
猪作为临床实验大型模式动物,其在异种器官移植、生物医学等领域研究中的作用日益凸显。五指山猪具有体形小、性成熟早、遗传稳定的特点,是培育试验用猪的理想猪种。 主要组织相容性复合体(Major histocompatibility complex,MHC)存在于脊椎动物的染色体上,编码主要组织相容性抗原。猪主要组织相容性复合体(Swine leukocyte antigen,SLA)位于 7 号染色体,SLA 的复杂性对探究以猪为供体的异种器官移植具有重要意义。目前,五指山猪 MHC I、Ⅱ类分子基因全长 DNA序列结构特征、分子限制性及多态性分布尚不清楚。因此,五指山猪实验动物的应用范围受到限制。鉴于此,明确五指山猪MHC I、Ⅱ类分子基因序列及其位置具有重要的理论意义和实际价值。 本研究结合二代、三代基因测序技术,对五指山猪7号染色体进行测序、组装和注释;基于测序所获得的基因组数据信息,对五指山猪MHC I、Ⅱ类分子基因进行鉴定与分析,深入研究五指山猪MHC复合体的生物学功能。主要研究结果如下: 1. 组装出无缺口的五指山猪7号染色体。采用二代Illumina、三代Nanopore以及H i-C技术相结合的方法,获得了五指山猪7号染色体序列,其大小约为135 Mb,Contig N50为135.64 Mb,杂合率为0.46%,BUSCO评估为98.0%。该组装结果表明五指山猪从端粒到端粒(Telomere-to-Telomere,T2T)基因组组装完整性较好。 2. 基因组重复序列注释结果表明,五指山猪 7 号染色体中重复序列含量为 64.09%。采用从头预测、同源注释和其他证据支持等方法,预测出五指山猪7号染色体包含1 687条蛋白质编码基因,获得基因完整性较高的注释和五指山猪 MHC I、Ⅱ 类分子基因序列。 3. 在全基因组水平上对MHC I、Ⅱ类分子基因进行鉴定,共筛选出16个MHC I、Ⅱ 类分子基因,I 类分子基因 8 个,分别为 SLA-2、SLA-2、SLA-1、SLA-2、SLA-11、MIC2、SLA-8、SLA-6;Ⅱ类分子基因8个,分别为SLA-DRA、SLA-DQA、SLA-DQB、SLA-DRB、SLA-DOB、SLA-DMB、SLA-DMA、SLA-DOA。使用 RT-PCR 方法扩增五指山猪MHC I、Ⅱ类分子基因编码序列(CDS)序列,采用Sanger测序法确定基因序列,将序列上传至 GenBank 并获得登录号,分别为:PQ182788、PQ182789、PQ182790、PQ182791、PQ182792、PQ182793、PQ182794、PQ182795、PQ182796、PQ182797、PQ182798、PQ182799、PQ182800、PQ182801、PQ182802、PQ164779。通过生物信息学分析工具对 MHC I、Ⅱ 类分子的蛋白理化性质、保守结构域和保守基序(Motif)进行分析,结果表明,有4个MHC I类分子和6个MHC Ⅱ类分子与别的猪种MHC I、Ⅱ类分子不在一个分支上;MHC I、Ⅱ 类分子相对分子量范围为 37.8~40.7 kDa 和27.7~30.0 kDa;归于同一亚区的基因含有相似的保守Motif。 本研究获得了高质量的五指山猪MHC复合体参考基因组和完整的注释基因集,为深入探究五指山猪MHC复合体的生物学功能、开发五指山猪MHC复合体基因编辑和敲除策略提供了精确的基因组序列,也为猪属种间的比较基因组学提供了重要资源。同时,本研究使用的多种测序技术相结合的组装策略,为其他猪种基因组组装提供了参考。