大豆科学2022,Vol.41Issue(3) :337-344.DOI:10.11861/j.issn.1000-9841.2022.03.0337

四种机器学习算法预测大豆蛋白质定位对比研究

Comparative Study of Four Machine Learning Algorithms for Soybean Protein Localization Predicting

李佳楠 高兴泉 李卓 滕小华 黄斌 张继成 唐友
大豆科学2022,Vol.41Issue(3) :337-344.DOI:10.11861/j.issn.1000-9841.2022.03.0337

四种机器学习算法预测大豆蛋白质定位对比研究

Comparative Study of Four Machine Learning Algorithms for Soybean Protein Localization Predicting

李佳楠 1高兴泉 2李卓 3滕小华 3黄斌 3张继成 4唐友1
扫码查看

作者信息

  • 1. 吉林农业科技学院电气与信息工程学院,吉林吉林132101;吉林化工学院信息与控制工程学院,吉林吉林132000
  • 2. 吉林化工学院信息与控制工程学院,吉林吉林132000
  • 3. 吉林农业科技学院电气与信息工程学院,吉林吉林132101
  • 4. 东北农业大学电气与信息工程学院,黑龙江哈尔滨150030
  • 折叠

摘要

为探索不同缺失程度大豆蛋白质亚细胞定位预测的有效方法,提升大豆蛋白质亚细胞定位预测能力,本研究以1万条已知亚细胞定位位置的大豆蛋白质序列数据为研究对象,进行5%、10%、15%、20%和30%不同缺失比例完全随机缺失,分别运用SVM算法、朴素贝叶斯算法和随机森林算法和决策树4种机器学习算法预测缺失序列的亚细胞位置,对原始位置和预测后的位置进行相关性分析,对比分析不同算法的准确性和性能.结果显示:随机森林算法预测的准确率最高;朴素贝叶斯算法的运行速度最快;朴素贝叶斯算法的运行内存最小.在不考虑运行时间和运行内存因素,且对预测的准确率要求较高的情况下,随机森林算法的预测效果要优于另外3种算法;同种情况下,若对运行内存要求较高时,可优先考虑朴素贝叶斯算法.结果说明不同机器学习方法在不同缺失程度的预测需求下的适用性,可应用于大豆蛋白质数据的定位预测.

关键词

支持向量机算法/朴素贝叶斯算法/决策树算法/随机森林算法/大豆蛋白质/完全随机缺失/序列位置预测

引用本文复制引用

基金项目

吉林省特色高水平学科新兴交叉学科"数字农业"(2018)()

吉林省智慧农业工程研究中心项目(2016)()

国家自然科学基金(31801441)

出版年

2022
大豆科学
黑龙江省农业科学院

大豆科学

CSTPCDCSCD北大核心
影响因子:0.641
ISSN:1000-9841
被引量1
参考文献量2
段落导航相关论文