首页|丹参长链非编码RNA及其与二萜类生物合成途径调控的相关性研究

丹参长链非编码RNA及其与二萜类生物合成途径调控的相关性研究

王琳

丹参长链非编码RNA及其与二萜类生物合成途径调控的相关性研究

王琳1
扫码查看

作者信息

  • 1. 成都中医药大学
  • 折叠

摘要

长链非编码RNA(longnoncodingRNA,lncRNA)通常被定义为一种功能独立于其蛋白质编码潜能的RNA,通常长度超过200nt(nucleotide)。近年来越来越多lncRNAs被发现参与包括植物次生代谢产物合成在内的多种生物过程,它们可以通过顺式或反式调控机制参与基因表达的调控。丹参(SalviamiltiorrhizaBunge)是中国重要的药用植物,其二萜类次生代谢产物成分(丹参酮类)是其主要药用成分之一。因此研究丹参中二萜类生物合成途径相关的lncRNAs,有利于加快全面揭示丹参二萜类成分生物合成与调控机制的步伐。本研究利用四种种质丹参花后期丹参酮类成分积累阶段根部的转录组数据,通过生物信息学方法鉴定丹参lncRNAs,并对它们进行了表征。基于lncRNA的顺反式调控作用,进一步分析了同时具有共定位和共表达关系的lncRNA-mRNA/TF(transcriptionfactor)基因对在茉莉酸甲酯(methyljasmonate,MeJA)诱导下的基因动态表达变化。同时,本研究还从空间位置层面研究了具有共定位关系的lncRNA-mRNA/TF基因对在四种不同背景条件下的表达相关性。得到的主要结果如下: (1)共鉴定到6,651个候选丹参lncRNAs,多数为新发现的lncRNA,它们具有lncRNA的普遍共性;基于二萜类生物合成相关的mRNA及TF基因,共获得45,198对共表达基因对,180对共定位基因对,其中23对同时具有共表达和共定位的关系。 本项研究利用四种种质丹参花后期丹参酮类成分积累阶段的转录组数据进行分析。首先是对丹参lncRNAs进行鉴定,通过NR、Swiss-Prot、KOG数据库对没有编码能力的转录本进行选取,保留序列长度大于200nt并且开放阅读框(openreadingframe,ORF)<100aa(aminoacid)的转录本,再通过CPC2和PLEK软件预测编码潜力,去除可能具有编码能力的转录本,并过滤掉低表达转录本,最终确定了6,651个候选丹参lncRNAs。然后是对收集到的丹参lncRNAs进行表征,在序列特征分析中发现lncRNAs普遍比mRNAs序列更短,GC含量更低;在lncRNAs序列保守性分析中发现,lncRNAs序列保守性差,但是相较于不同科的植物,丹参lncRNAs在同属植物中的序列保守性较高;在丹参启动子区转座子分析中发现,lncRNAs和mRNAs/TFs基因在启动子区转座子分布上存在差异;丹参lncRNAs亚细胞定位预测结果表明,lncRNAs大部分分布在细胞质和细胞核;丹参miRNA的前体及靶点预测分析结果表明17个lncRNAs可能作为miRNA的前体、14个lncRNAs可能作为miRNA潜在靶标;基于lncRNA的顺式调控作用,分析了6,651个候选lncRNAs与46个二萜类生物合成途径基因及11个二萜类生物合成相关的TFs基因的表达相关性(Pearsoncorrelationcoefficient,PCC)和共定位情况,共得到45,198对|PCC|≥0.4的共表达lncRNA-mRNA/TF基因对,180对共定位lncRNA-mRNA/TF基因对,其中23对lncRNA-mRNA/TF基因对同时具有共表达和共定位关系;基于lncRNA的反式调控作用,分析了lncRNA的反式作用靶点,通过LncTar软件预测得到844个反式作用基因对。在差异表达分析中,共得到21个在丹参的丹参酮类成分积累阶段差异表达的lncRNAs。 (2)同时具有共定位和共表达关系的lncRNA-mRNA/TF基因对,在MeJA诱导下形成三个基因表达网络模块。 为了进一步探索具有共定位和共表达相关性的基因对的调控作用,使用MeJA处理丹参苗,分析这些基因对在6、12、24和48h诱导后的动态表达情况,共得到19个在MeJA诱导后至少一个时间点差异表达的基因,并且构建了3个lncRNA-mRNA/TF基因表达网络模块。 (3)共定位的lncRNA-mRNA/TF基因对在不同背景条件下的表达相关性存在差异。 利用丹参花后期丹参酮类成分积累阶段、不同程度干旱胁迫下、雷帕霉素靶蛋白(targetofrapamycin,TOR)信号途径扰动下的转录组数据,以及茉莉酸甲酯诱导下的基因动态表达情况,从空间位置层面综合分析了共定位lncRNA-mRNA/TF基因对在不同背景条件下的表达相关性,结果表明,在丹参酮类成分积累阶段呈现表达正相关性的Smlnc0008477-Sm0056000(CPS)基因对和Smlnc0070114-Sm0009433(MYB36)基因对,在MeJA诱导下表达也呈现正相关性;Smlnc0019429-Sm0026208(WRKY2)基因对和Smlnc0000154-Sm0067238(GA2ox10)基因对在丹参花后期丹参酮类成分积累阶段和不同程度干旱胁迫下表达均呈现相关性,但是它们均在丹参酮类成分积累阶段呈现正相关性,在干旱胁迫下相关性呈现负相关性;Smlc0056362-Sm0009942(bHLH148)基因对在不同程度干旱胁迫下和TOR信号途径扰动下均呈现表达负相关。 综上所述,本研究鉴定了新的丹参lncRNAs,并探讨了在丹参二萜类生物合成途径中发挥顺式调控作用的lncRNA的功能,揭示出了lncRNAs、mRNAs和TFs之间关系的复杂性,为深入理解lncRNA与丹参二萜类生物合成途径的关系提供了新的见解。

关键词

丹参/生物合成/长链非编码RNA/二萜类生物合成途径/基因表达网络模块

引用本文复制引用

授予学位

硕士

学科专业

中药学

导师

陈新

学位年度

2023

学位授予单位

成都中医药大学

语种

中文

中图分类号

R2
段落导航相关论文