摘要
大豆是世界上重要的油料作物,2018年约占全球油料作物产量的61%和全球植物油总消耗量的28%。大豆油中约98.4%的成分由棕榈酸、硬脂酸、油酸、亚油酸和亚麻酸等5种脂肪酸组成,富含不饱和脂肪酸,为人类提供优质的植物油。因此,提高大豆籽粒油脂含量和改善脂肪酸构成是大豆改良育种的重要目标之一。我国是大豆的起源中心,并拥有丰富的大豆种质资源。在经历驯化和改良后,大豆籽粒中的油脂含量显著升高,但造成籽粒油脂含量发生显著变化的遗传基础尚不完全清楚。籽粒油脂含量和脂肪酸组成是多基因控制的数量性状,其代谢过程需要多个途径协同作用完成,有多少基因参与大豆油脂代谢仍在探索中。因此,研究大豆籽粒油脂性状在驯化和改良过程中的演化规律并挖掘优异基因,对进一步改良大豆籽粒油脂性状具有重要意义。 本研究对来源于我国6个不同生态区的187份地方品种和195份育成品种进行多年种植并测定其籽粒油脂含量及脂肪酸组成,通过覆盖大豆全基因组的SNP标记进行群体进化分析及油脂性状关联分析,鉴定出了高油脂含量和高油酸含量的大豆种质、在改良过程中受到选择的位点且与油脂性状显著关联的候选位点。随后利用基因表达分析、植物转基因技术及群体遗传学方法揭示了蔗糖转运蛋白基因GmSWEET39(SugarsWillEventuallybeExportedTransporter)影响大豆籽粒油脂含量并显著受到人工选择。此外,结合全基因组关联分析及KEGG代谢通路分析,挖掘出其他与大豆油脂和5种脂肪酸含量显著关联的候选位点及其附近区域的候选基因。本研究获得的主要结果如下: 1.中国栽培大豆籽粒油脂性状的特点及优异种质资源的鉴定 通过近红外和气相色谱的方法,测定中国不同地区的187份地方品种和195份育成品种2012年、2014年和2015年籽粒油脂含量及脂肪酸组成,结果显示382份大豆种质的籽粒油脂含量变异幅度为15.80%~24.43%,油酸含量变异幅度为14.94%~38.45%,其中地方品种的籽粒油脂平均含量为19.77%,育成品种的籽粒油脂平均含量为20.93%,表明经过长期的大豆改良(从地方品种到育成品种),籽粒油脂含量在育成品种中得到提高。进一步对382份大豆种质的籽粒油脂及脂肪酸组分含量进行相关性分析,发现籽粒油脂含量与油酸含量呈显著正相关(r=0.19,P<0.01),与棕榈酸(r=-0.2,P<0.01)、亚麻酸含量(r=-0.55,P<0.01)呈显著负相关。 2.大豆改良过程中与籽粒油脂含量显著相关的选择性清除区域 为了鉴定从地方品种到育成品种的改良过程中受到选择的位点,本研究利用全基因组71293个SNP标记(稀有等位变异频率MAF≥0.05)对187份地方品种和195份育成品种进行选择性清除分析(群体固定指数FST及多样性降低ROD),并以全基因组范围内前2%的SNP标记作为受到选择作用的显著位点(相应于FST≥0.19和ROD≥0.84),结果发现共有47个位点同时满足FST和ROD显著阈值。进一步将这47个位点的物理位置与Soybase数据库中已收录籽粒油脂含量QTL的物理位置相比较,发现其中25个显著位点位于已定位的油脂相关QTL物理位置内部,这些显著位点所在区域可能是大豆改良过程中与籽粒油脂含量显著相关的选择性清除区域。 3.GmSWEET39是大豆改良过程中控制籽粒油脂含量的候选基因 很多调控油脂积累的基因在籽粒中特异性高表达,因此,为挖掘上述25个显著位点附近的候选基因,我们首先利用Soybase数据库中的RNA-Seq数据分析这些显著位点在连锁不平衡LD(所有染色体的平均值为786kb)范围内的所有864个基因在大豆不同组织中的表达情况,结果显示5个基因在大豆籽粒中高表达,它们分别是Glyma.08g116300,Glyma.09g185500,Glyma.15g049200,Glyma.08g088000和Glyma.15g050800。进一步在含油量差异较大的两个大豆品种开花后10天、20天、30天和40天的籽粒中分析5个候选基因的表达水平,发现仅有Glyma.15g049200(GmSWEET39)基因在多个时期的籽粒中高油品种的表达水平显著高于低油品种的表达水平。 4.大豆GmSWEET39基因的功能验证及优异单倍型分析 选取高油品种“科新4号”(籽粒含油量22.84%)不同组织分析GmSWEET39基因的组织表达特点,发现GmSWEET39基因在大豆籽粒及叶片中表达水平较高,其中在开花后30天籽粒中的表达量最高。随后我们从382份材料中选取含有高、中、低不同含油量的80份微群体种质,并检测其开花后30天籽粒中GmSWEET39基因的相对表达水平,发现GmSWEET39基因的相对表达水平与籽粒油脂含量呈显著正相关(r=0.63,P=4.35e-10)。在烟草叶片及拟南芥原生质体中的瞬时表达结果显示GmSWEET39蛋白的亚细胞定位在细胞膜上。 利用特异性引物分别扩增80份大豆种质中GmSWEET39基因的1.6kb启动子序列及编码序列(CDS)全长。基于GmSWEET39基因序列中的多态性位点,启动子区域被分为3种不同类型(Pro1-Pro3)、CDS区域被分为两种不同类型(CDS1-CDS2)、两者组合将GmSWEET39基因分为6种不同单倍型(Hap1-Hap6)。随后分析GmSWEET39基因不同单倍型对籽粒油脂含量及基因相对表达量的影响,发现携有GmSWEET39基因的Hap6(Pro3+CDS2)、Pro3及CDS2单倍型的种质平均籽粒油脂含量及GmSWEET39基因的相对表达量显著高于携有其他单倍型的种质,表明等位变异Hap6(Pro3+CDS2)、Pro3及CDS2可能是影响籽粒油脂含量的优异单倍型。 为了验证GmSWEET39基因优异单倍型的功能,我们首先以35S作为启动子在拟南芥中分别过表达GmSWEET39基因的两种不同CDS类型,共获得5个35S∶GmSWEET39CDS1的过表达株系和10个35S∶GmSWEET39CDS2的过表达株系,气相色谱分析发现过表达GmSWEET39CDS2的拟南芥株系成熟籽粒中的脂肪酸含量平均提高33%,然而过表达GmSWEET39CDS1的拟南芥成熟籽粒中脂肪酸含量与空载对照无显著差异。我们通过转基因大豆发根发现过表达35S∶GmSWEET39CDS2或GmSWEET39Pro3∶GmSWEET39CDS2(即GmSWEET39Hap6)的大豆发根中脂肪酸含量不仅显著高于空载对照,也显著高于过表达35S∶GmSWEET39CDS1的大豆发根。此外,本研究在重组自交系群体的155个家系中进一步证实携有GmSWEET39Pro3、GmSWEET39CDS2或GmSWEET39Hap6的家系具有较高的大豆籽粒油脂含量。以上结果表明GmSWEET39CDS2或GmSWEET39Pro3与GmSWEET39CDS2组合是可以提高脂肪酸含量的优异等位变异。随后我们在41份野生大豆中测定GsSWEET39基因的序列,发现这些种质中包含22种不同GsSWEET39基因单倍型,其中启动子区域具有19种不同类型,CDS区域具有5种不同类型,说明野生大豆比栽培大豆中的SWEET39基因具有更加丰富的变异。另外,野生大豆中优异等位单倍型的频率明显低于栽培大豆,暗示在野生大豆向栽培大豆的驯化过程中SWEET39基因可能经历了选择作用。 5.其他影响大豆籽粒油脂及脂肪酸含量的位点及候选基因 为鉴定其他影响大豆籽粒油脂性状的遗传位点和候选基因,我们用382份大豆种质籽粒油脂及5种脂肪酸含量三年表型数据的BLUP(最佳线性无偏差预测)值和MAF≥0.05的71293个SNP标记进行全基因组关联分析。以假阳性率FDR≤0.1作为显著性阈值,本研究共检测到12个与籽粒油脂含量显著关联的SNP位点、12个与亚油酸含量显著关联的SNP位点和7个与亚麻酸含量显著关联的SNP位点。进一步对显著关联位点LD范围内的基因进行基因注释和代谢途径分析,我们在5号染色体38.47Mb-38.56Mb区域附近、8号染色体6.89Mb-7.08Mb区域附近和12号染色体5.37Mb-5.43Mb区域附近分别预测了12个、10个和2个油脂性状相关候选基因。后续对这些候选基因的功能研究将为改良大豆籽粒油脂性状提供材料基础和理论依据。