查看更多>>摘要:自转录活性调节区测序(self-transcribing active regulatory region sequencing,STARR-seq)是一种可发现并同时验证全基因组增强子活性的高通量测序方法。其原理为:将待验证序列插入质粒载体并电转入细胞中,该序列在作为增强子提高靶基因转录的同时,其本身也作为靶基因被增强转录。通过对转录组进行测序,并对比未插入片段的测序结果,可获得增强子在基因组位置及活性的信息。在传统增强子研究方法中,通过对染色质开放区域和转录活性区域进行测序以预测增强子,但只能逐一验证预测结果,无法高通量验证增强子活性。STARR-seq技术解决了上述缺陷,可在对全基因组增强子高通量挖掘的同时,对其活性进行可靠的验证。自STARR-seq技术发明以来,已被广泛运用于不同物种与细胞中的增强子发现及活性验证研究。本文对传统增强子预测方法以及STARR-seq技术的基本原理、发展历史和具体运用进行了介绍,并对其发展前景进行展望,以期为后续增强子相关领域研究人员提供参考。
查看更多>>摘要:酶功能的识别对理解生命活动的机制、推进生命科学的发展有重要作用。然而现有的酶EC编号预测方法,并未充分利用蛋白质序列信息,在识别精度上仍有所不足。针对上述问题,本研究提出一种基于层级特征和全局特征的 EC 编号预测网络(EC number prediction network using hierarchical features and global features,ECPN-HFGF)。该方法首先通过残差网络提取蛋白质序列通用特征,并通过层级特征提取模块和全局特征提取模块进一步提取蛋白质序列的层级特征和全局特征,之后结合两种特征信息的预测结果,采用多任务学习框架,实现酶EC编号的精确预测。计算实验结果表明,ECPN-HFGF方法在蛋白质序列EC编号预测任务上性能最佳,宏观F1值和微观F1值分别达到95。5%和99。0%。ECPN-HFGF方法能有效结合蛋白质序列的层级特征和全局特征,快速准确预测蛋白质序列EC编号,比当前常用方法预测精确度更高,能够为酶学研究和酶工程应用的发展提供一种高效的思路和方法。