首页|基于递归特征消除和随机森林融合算法的大豆前体MicroRNA预测模型研究

基于递归特征消除和随机森林融合算法的大豆前体MicroRNA预测模型研究

扫码查看
随着大豆RNA基因的生物调控作用研究的不断深入,利用数据挖掘技术对大豆前体MicroRNA(pre-microRNA)进行有效的预测已成为该领域的重要发展方向.针对常规的随机森林算法在pre-microRNA预测模型中存在识别精度较低的问题,研究提出并构建基于递归特征消除(reeursive feature elimination,RFE)与随机森林(random forest,RF)融合算法的大豆pre-microRNA预测模型.首先利用递归特征消除法筛选大豆pre-microRNA序列的最优特征子集;然后结合随机森林算法构建大豆pre-microRNA的预测模型;最后利用十折交叉验证法,将递归特征消除与随机森林(RFE-RF)融合模型的预测结果与单一随机森林和支持向量机分类模型的预测结果对比.研究结果表明:融合后构建的大豆pre-microRNA预测模型精度有明显提高,达到84.62%,相比于支持向量机算法(support vector machine,SVM)构建的模型精度提高了17.02%,相比于单独使用随机森林算法构建的模型精度提高了14.58%.该研究方法为大豆的pre-microRNA基因预测提供了新思路.
Research on Soybean Pre-Micro RNA Prediction Model Based on Recursive Feature Elimination and Random Forest Fusion Algorithm

安宇、陈桂芬、李静

展开 >

吉林农业大学信息技术学院,吉林长春130118

大豆 Pre-microRNA 递归特征消除 随机森林 预测模型

国家星火计划吉林省重点科技研发项目

2015GA66000420180201073SF

2020

大豆科学
黑龙江省农业科学院

大豆科学

CSTPCDCSCD北大核心
影响因子:0.641
ISSN:1000-9841
年,卷(期):2020.39(3)
  • 4
  • 7