基于类不平衡的软件缺陷倾向性预测研究

Research on Software Defect Propensity Prediction Based on Imbalanced Datasets

程雪平 ¹陈海华¹

扫码查看

作者信息

1. 广州华商学院数据科学学院,广州 511300
折叠

摘要

软件缺陷倾向性预测是提高软件测试效率、保证软件质量的重要手段之一,类不平衡是软件缺陷数据集中固有的问题.利用公开的NASA软件缺陷数据仓库中的部分数据集,分别采用随机过采样、人工少数类过采样法(synthetic minority over⁃sampling technique,SMOTE)、改进的SMOTE过采样算法处理类不平衡问题,然后使用随机森林预测模型对各软件模块的缺陷倾向性进行预测,最后利用查准率、召回率、AUC等性能评价指标对比不同采样方法处理缺陷数据集类不平衡问题的效果.

关键词

机器学习/类不平衡/缺陷倾向性预测/过采样/随机森林模型

引用本文复制引用

基金项目

广州华商学院青年学术类科研项目(2021)(2021HSQX50)

出版年

2022

现代计算机

中大控股

现代计算机

影响因子：0.292

ISSN：1007-1423

参考文献量11

段落导航