现代计算机2022,Vol.28Issue(24) :15-21.DOI:10.3969/j.issn.1007-1423.2022.24.003

基于类不平衡的软件缺陷倾向性预测研究

Research on Software Defect Propensity Prediction Based on Imbalanced Datasets

程雪平 陈海华
现代计算机2022,Vol.28Issue(24) :15-21.DOI:10.3969/j.issn.1007-1423.2022.24.003

基于类不平衡的软件缺陷倾向性预测研究

Research on Software Defect Propensity Prediction Based on Imbalanced Datasets

程雪平 1陈海华1
扫码查看

作者信息

  • 1. 广州华商学院数据科学学院,广州 511300
  • 折叠

摘要

软件缺陷倾向性预测是提高软件测试效率、保证软件质量的重要手段之一,类不平衡是软件缺陷数据集中固有的问题.利用公开的NASA软件缺陷数据仓库中的部分数据集,分别采用随机过采样、人工少数类过采样法(synthetic minority over⁃sampling technique,SMOTE)、改进的SMOTE过采样算法处理类不平衡问题,然后使用随机森林预测模型对各软件模块的缺陷倾向性进行预测,最后利用查准率、召回率、AUC等性能评价指标对比不同采样方法处理缺陷数据集类不平衡问题的效果.

关键词

机器学习/类不平衡/缺陷倾向性预测/过采样/随机森林模型

引用本文复制引用

基金项目

广州华商学院青年学术类科研项目(2021)(2021HSQX50)

出版年

2022
现代计算机
中大控股

现代计算机

影响因子:0.292
ISSN:1007-1423
参考文献量11
段落导航相关论文