摘要
月季,作为蔷薇科蔷薇属的一员,因其花色繁多、形态各异以及四季绽放的特性 而广受消费者喜欢。大部分现代月季是四倍体,其染色体呈现节段异源四倍体特征, 这一点为解析现代月季基因组带来了挑战。同源染色体来源的复杂性导致了现代月季 基因组高度嵌合,使用常规的基因组组装方法来解析单倍型基因组变得尤为困难。随 着月季产业的持续发展,市场对既具备优秀性状又拥有强健抗病性的月季新品种需求 持续上升。因此,探究现代月季的进化起源、人工驯化位点,以及通过全基因组关联 分析识别控制性状的关联位点,这一研究工作显得尤其重要。通过识别性状的关联位 点,不仅可以显著提高育种效率,突破现有育种进程中的限制,而且在月季性状的早 期筛选中起到决定性的作用。 本研究采用一种创新的组装策略,提升单倍型解析效果,成功构建了首个单倍型 解析的现代月季‘萨曼莎’基因组。通过分析233个蔷薇属种质的重测序数据,深入 探讨了现代月季的群体结构和遗传组成,明确了现代月季‘萨曼莎’各个染色体的潜 在来源。进一步鉴定了四倍体现代月季人工驯化选择的区域,明确了受人工驯化选择 基因。最终,本研究通过对358份四倍体月季种质进行高深度的重测序,并利用全基 因组关联分析技术,成功鉴定了与多个性状相关的位点。特别是,鉴定出了一个与花 瓣数量相关的基因——APETALA 2-like(AP2L)。进一步通过实验验证了 AP2L基因在 调控花瓣数量方面的作用。主要研究结果如下: (1)现代月季基因组的单倍型解析:首先,本研究采用ONT超长数据、HiFi数 据和Hi-C数据混合组装contigs,以获得高连续性的contigs,并利用Pore-C测序技 术将其挂载到染色体上,避免了同源序列导致的定相错误。其次,通过比对HiFi数 据的深度,识别基因组中的潜在“坍缩”区域,并鉴定这些区域对应的unitigs。然后, 利用Hi-C数据重新挂载“坍缩”区域的序列,并借助Juicebox软件进行手动矫正, 从而修正“坍缩”区域,完成高质量的单倍型解析基因组组装。基于组装的现代月季 基因组,开展了同源染色体间的基因保留和基因表达偏移分析,发现同源染色体间在 基因数量和表达上没有显著性差异。 (2)现代月季的进化起源及重要性状人工驯化分析:本研究首先利用233个蔷 薇属种质的重测序数据,探究了现代月季的群体结构,揭示了现代月季是通过香水月 季、‘月月粉’、光叶蔷薇、法国蔷薇、麝香蔷薇、腺果蔷薇等原始种的杂交而形成的。 随后,对‘萨曼莎’月季各染色体的遗传组成进行了深入分析,确定了原始种对其基 因组的潜在贡献区域,发现现代月季染色体呈现“马赛克”状的特征,侧面验证了同 源染色体间的局部重组现象。进一步发现,与过渡品种相比,现代月季出现了育种瓶 颈,核苷酸多样性明显下降,这限制了现代月季育种的进一步发展。本研究确定了现 代月季的人工驯化位点,并且鉴定了影响重瓣、连续开花性、乙烯敏感性、抗病性、 花序等关键性状的候选基因。 (3)四倍体月季种质的全基因组关联分析:首先,利用系统发育树和流式细胞 术成功鉴定了 358份四倍体月季种质资源。随后,开展了连续3年的性状调查进一步 明确了多个性状表型。最终,通过全基因组关联分析成功识别了多个性状的关联位点, 特别是发现了一个与月季花瓣数量相关基因——APETALA 2-like。通过原位杂交、转 录组学分析和病毒介导的基因沉默(VIGS),进一步验证了APETALA 2-like基因与月 季花瓣数量之间的关系。 本研究首次尝试综合应用多种测序数据和组装方法,成功优化了四倍体现代月季 基因组的组装策略,实现了高质量的单倍型基因组构建。同时,通过对蔷薇属种质重 测序数据的分析,揭示了现代月季的群体结构和遗传组成,鉴定了人工驯化过程中关 键性状的候选基因,明确了现代月季的驯化方向和育种历史。此外,全基因组关联分 析揭示了与月季重要性状的关联位点,为四倍体现代月季的分子层面研究和分子标记 辅助育种提供了新的思路和关键遗传位点。该结果不仅揭示了现代月季进化起源及人 工驯化方向,也为现代月季的育种和改良提供了基因型数据资源。