摘要
梨是世界上重要的温带果树树种,具有较高的营养价值。但是由于梨童期长、自交不亲和的特性,传统的杂交育种在改良梨树的性状方面效率较低。随着高通量测序技术的飞速发展,大数据时代梨树的育种出现了前所未有的机遇。从第一个‘砀山酥梨’基因组的组装和公布,到后来海量的重测序、转录组、代谢组、蛋白组学数据的释放,为大数据分析促进梨分子辅助育种奠定了坚实的基础。本研究基于重测序和转录组数据,对梨中IBD、lncRNA及LBD基因家族进行了全基因组的鉴定和进化分析,具体结果如下: 1、研究利用 113 份梨品种资源的重测序数据,鉴定了亚洲梨和西洋梨驯化过程中的基因流动。研究共鉴定到 3320796 个 IBD 片段,相比于西洋梨中的野生和栽培梨,亚洲梨中的野生和栽培梨之间存在着相对较多的IBD片段,说明亚洲栽培梨和野生梨之间具有更广泛的基因流动。通过将染色体划分为500 kb的窗口,统计IBD在染色体上的富集分布,并鉴定到1个位于15号染色体、长度达3 Mb的亚洲栽培-亚洲野生和欧洲栽培-欧洲野生所共有的 IBD富集区间。KEGG富集分析表明,该区间与梨果实成熟有关。研究结果表明,在亚洲和欧洲梨的驯化过程中,与果实成熟相关的性状受到育种过程的影响。同时,选择消除分析表明,该3 Mb区间在驯化的过程中经受了强烈的人为选择。进一步基于164份栽培梨的全基因组关联分析,我们鉴定了3 Mb区间内与梨果实硬度相关的重要候选基因。 2、本研究通过41份链特异性lncRNA测序数据,对梨基因组中的lncRNA进行了鉴定,共获得12155个可信度高的lncRNA。根据位置信息,可以将梨中lncRNA分为三大类:lincRNA(基因间区长链非编码RNA , 10665个),NATs(天然反义转录本, 1000个),incRNAs(内含子区间的长链非编码RNA , 490个)。相比于蛋白编码基因,梨中lncRNA具有长度短,外显子数目少,表达水平低,表达变异系数高等特性。同时,发现lncRNA对毗邻的基因具有的正向调控作用要大于负向调控。相比于蛋白编码基因,梨中的lncRNA具有更高比例的转座子(TE)插入。 3、在白梨基因组中,共鉴定到60个非冗余的、完整的LBD基因家族成员。基于进化树和基因结构分析,60个LBD基因被分为两类,class I (53个LBD基因)和class II (7个LBD基因)。顺式作用元件分析表明,LBD基因参与多个生物学过程,如类黄酮代谢和干旱胁迫反应等。共线性分析表明全基因组复制/片段复制是LBD基因家族进化的主要扩张方式。LBD基因家族经历了最近一次全基因组复制事件,其大约发生在30-45百万年前,纯化选择是LBD基因家族进化的主要动力。基于‘砀山酥梨’ 6个不同组织的转录组数据,发现10个LBD基因在6个组织中均有表达,其中73.33 % 的 LBD 基因家族的基因在萼片中表达。最后,qRT-PCR 分析检测了 11 个LBD基因的表达模式,且在子房中具有较高的表达水平。基于‘满天红’套袋和去袋处理的转录组数据,发现3个LBD基因在去袋处理的梨中显著下调,而1个基因显著上调。因此,最终鉴定到参与调控花青苷合成的4个重要候选基因。