摘要
生物的全基因组信息对于解析关键性状分子调控机制,助力分子设计育种,缩短育种年限非常重要。金边红苞凤梨(Ananascomosusvar.bracteatusf.tricolor,2n=50)因其果实苞片为红色,且具有绿白镶嵌的金边嵌合叶片,嵌合叶片会因花青素的积累而呈现出艳丽的红色而成为重要的观叶植物。叶片花青素的含量和种类组成决定了其叶片颜色的呈现,尤其是在金边白化组织中。深入理解其叶色形成的分子机理,是通过分子设计育种手段创制多彩叶色新品种的理论基础。但缺乏参考基因组信息限制了我们对其花青素合成相关调控基因的定位和克隆,进而难以绘制其完整的分子调控网络用于分子设计育种工作。因此,本文构建了金边红苞凤梨的参考基因组,解析了金边红苞凤梨的基因组特点,搭建了凤梨科基因组数据库(BromeliaceaeGenomicDatabase,BGD,http://124.70.188.239:8200/)。并在此基础上,整合目前已发表的金边红苞凤梨多组学测序数据,对金边红苞凤梨叶片花青素合成关键调控基因进行了初步筛选和验证,获得的主要研究结果如下: 1、本研究结合高深度的PacBio测序、Illumina测序和Hi-C测序,开发了针对高杂合率、高重复率金边红苞凤梨基因组的组装策略,获得了金边红苞凤梨染色体水平的高质量参考基因组。基因组大小为~461Mb、ContigN50为2.97Mb,ScaffoldN50为19.43Mb,超过99%以上的基因组序列被挂载到25条假染色体上且基因组BUSCOs评估显示金边红苞凤梨参考基因组完整性达到了97.3%。将金边红苞凤梨参考基因组与另外3个凤梨属(Ananas)植物参考基因组从完整性和连续性等指标进行比较,金边红苞凤梨基因组是目前组装质量最高的凤梨属植物基因组。此外,基因组注释结果表明金边红苞凤梨基因组中约68.2%的序列为重复序列,蛋白编码基因26,113个,snRNA、miRNA、tRNA和rRNA这四类非编码RNA的数量分别为194、142、379和94个。 2、对金边红苞凤梨和另外12个单子叶植物的比较基因组学分析显示菠萝(Ananascomosus)和红苞凤梨(Ananascomosusvar.bracteatus)类观赏凤梨在~19.64百万年前(Mya)分化,并鉴定到45个可能与金边红苞凤梨适应性机制有关的正选择基因。群体遗传分析表明金边红苞凤梨遗传背景单一。没有明显的群体混合现象,而红苞凤梨野生品系“CB5”则存在群体混合现象,与菠萝“卡因”和“皇后”品种有杂交史。最后,将金边红苞凤梨基因组与“卡因”菠萝品系“F153”和红苞凤梨野生品系“CB5”的基因组分别进行基因组存在/缺失变异(presence/absencevariation,PAV)分析,鉴定出金边红苞凤梨基因组上的特异性序列和缺失序列,这些序列信息可为解析不同品种的遗传差异和凤梨属植物泛基因组的构建提供参考。 3、本研究基于PythonFlask网络框架,搭建了BGD数据库。数据库目前收录了5个凤梨科(Bromeliaceae)植物及模式植物拟南芥(Arabidopsisthaliana)和水稻(Oryzasativa)的基因组数据,并配套开发了6个功能模块:账户模块、检索模块、序列比对模块、基因组可视化模块、下载模块和讨论模块。用户可通过网页访问的形式实现基因信息检索、序列比对、基因组可视化及问题讨论等操作。而除了数据库收录的基因组数据,用户还能在BGD数据库的下载模块获取本文进行比较基因组学分析、群体遗传学分析、变异分析、基因表达分析、WGCNA共表达分析的详细结果。 4、本研究整合目前已发表的金边红苞凤梨多组学测序数据对其叶片花青素合成关键调控基因进行了初步筛选和验证。首先基于本地BLAST比对在全基因组范围初步鉴定了62个花青素合成途径结构基因,并通过这62个基因在不同颜色叶片的差异表达分析及转录组和代谢组联合关联分析,筛选出7个关键结构基因(1个AbPAL、2个Ab4CL、2个AbCHI、1个AbF3H和1个AbDFR),这7个基因涉及花青素合成途径的全部3个阶段。之后,整合20个不同颜色、不同发育时期的叶片转录组数据进行WGCNA共表达分析,筛选出3个可能与叶片花青素合成密切相关的模块。根据这三个模块所含的转录因子和花青素合成途径结构基因的关联权重和蛋白互作网络分析进一步筛选出2个可能在金边红苞凤梨叶片花青素合成中扮演重要调控作用的MYB类转录因子(11g000160.1_MYB和17g010700.1_MYB)。最后,我们通过不同颜色叶片的色素含量测定和实时荧光定量PCR分析,初步验证了RNA-Seq分析的结果。 本文执行数据分析所编写的Python、R及Shell代码已经上传到代码托管平台Github,下载地址为https://github.com/leeun67/GL1_script/。金边红苞凤梨基因组数据可在BGD数据库或者NCBI(项目号PRJNA747096)下载。