摘要
第二代高通量RNA-Seq测序技术已成为转录组分析的标准技术手段.寻找差异表达基因作为RNA-Seq测序数据分析中最基本任务之一,提出了大量的分析方法.但是这些不同方法检测出的差异基因往往存在结果不一致性,并且综述性评估已经证明单一方法无法在所有数据集中一直保持优势.因此,提出了一种快速鲁棒的RNA-Seq数据寻找差异表达基因方法RobustDEA,通过自动加权方式结合多种寻找差异表达基因方法,其权值可快速的数据集中学习获得,能有效的体现不同数据集的特点,从而使得RobustDEA方法在不同数据集上都可获得稳定的结果.通过包含qRT-PCR验证的人类大脑数据集和多个老鼠数据集的评估,相比于单个差异表达基因方法和其他结合方法,RobustDEA方法都能获得最准确的预测结果,且表现出很好的鲁棒性能.此外,与PANDOR结合方法相比,RobustDEA方法能大幅度提高计算效率.
基金项目
国家自然科学青年基金(61802193)
江苏省自然科学基金(BK20170934)
南京林业大学青年科技创新基金(CX2017031)
南京林业大学大学生创新训练计划(2018NFUSPITP452)
汕尾市省级科技创新战略专项(2018D2002)