摘要
棉花是重要的纤维作物和油料作物,陆地棉是世界上种植面积最大的栽培种之一,其产量和品质是育种追求的首要目标。根系是植物吸收水分和养分的直接器官,根系构型已被证实对非生物胁迫的耐受性、物种的适应性具有重要意义。全基因组关联分析(GWAS)是研究作物复杂数量性状的有效方法,以相关表型数据进行GWAS分析,可以挖掘与性状显著关联的遗传位点和候选基因,为重要农艺性状的遗传解析提供理论支撑和基因资源。本研究通过242份陆地棉自然群体苗期的总根长、根投影面积、根表面积、根体积、根平均直径、主根长、根鲜重共计7个表型性状和来源于陆地棉CottonSNP80K芯片的高密度分子标记进行全基因组关联分析,挖掘了一批与棉花根表型性状相关的重要QTNs和优异候选基因。主要研究结果如下: 1.根表型性状的变异分析和相关性分析 总根长、根投影面积、根表面积、根体积、根平均直径、主根长、根鲜重7个表型的变异范围均较广且丰富,变异系数变幅为18.48%~46.78%。相关性分析表明,除根平均直径和主根长、根投影面积、根表面积,根鲜重和主根长、根平均直径、根体积无相关关系外,其他各性状之间均互为显著的相关关系。其中总根长和根平均直径、总根长和根鲜重、根投影面积和根鲜重、根表面积和根鲜重呈显著负相关关系,相关系数变幅为-0.17~-0.31;除此之外的其他各性状之间均呈显著的正相关关系,相关系数变幅为0.15~0.88。 2.根表型相关性状的全基因组关联分析 利用前期CottonSNP80K芯片研究中242份陆地棉自然群体基因分型分析获得的56,010个高质量SNP位点,采用多位点混合线性模型(mrMLM)对根系的7个表型性状进行GWAS分析。共检测到169个显著关联位点,广泛分布于不同的染色体上,其中A组86个,D组83个,在A组染色体和D组染色体中共发现7个QTN聚集区(A01、A07、A09、A12、D02、D06、D12)。关联位点数量大于10的染色体有A06(10个),A08(11个),D02(10个)。在表型性状方面,主根长关联到44个SNP,解释1.76%~22.23%的表型变异;根鲜重关联到41个SNP,解释0.44%~20.12%的表型变异;根体积关联到33个SNP,解释0.40%~31.67%的表型变异;根投影面积关联到27个SNP,解释1.73%~17.98%的表型变异;总根长和根表面积均关联到25个SNP,分别解释1.60%~19.26%、1.90%~24.26%的表型变异;根平均直径关联到16个SNP,解释0.31%~18.07%的表型变异。以显著关联位点两侧200Kb为区间,共找到基因1119个,对这些基因进行的功能富集(GO)分析表明,主要涉及酰胺生物合成、有机氮化合物代谢、细胞氮化合物生物合成、萜类生物合成等通路。 3.根表型性状候选基因的功能初步分析 在显著关联位点中,两个及以上性状共定位且在群体中存在优异倍型纯合性的SNP位点有24个,其中五个性状同时关联到位点TM14632,四个性状同时关联到位点TM56624,三个性状重复关联的位点有9个,两个性状重复关联的位点有13个。以重复关联优异位点两侧200Kb区间、基因在根中表达量大于等于10、转录因子作为筛选候选基因的条件,共找到候选基因30个,包括NAC、bZIP、WRKY等转录因子家族。对编码C2H2锌指蛋白的GhYY1和编码WPP结构域蛋白的GhWPP2进行SNP鉴定和VIGS实验。结果表明与TRV:00相比,沉默GhWPP2植株的主根长、根表面积和根投影面积显著或极显著降低;沉默GhYY1植株的根鲜重、根体积、根平均直径、根投影面积、根表面积和总根长显著或极显著升高。沉默GhWPP2植株的根系发育受到一定程度的负调控,而沉默GhYY1的植株则受到一定程度的正调控,这与GWAS的QTN效应分析结果相一致。 综上所述,本研究通过对存在广泛遗传变异的7个根表型性状进行GWAS分析,成功挖掘了一批与根形态发育显著相关的QTNs和候选基因,同时利用VIGS技术对其中2个候选基因进行了功能的初步验证。这些研究结果为后续根发育生物学和育种利用研究提供了理论基础。