首页|基于数据过采样和集成学习的软件缺陷数目预测方法

基于数据过采样和集成学习的软件缺陷数目预测方法

扫码查看
预测软件缺陷的数目有助于软件测试人员更多地关注缺陷数量多的模块,从而合理地分配有限的测试资源.针对软件缺陷数据集不平衡的问题,提出了一种基于数据过采样和集成学习的软件缺陷数目预测方法——SMOTENDEL.首先,对原始软件缺陷数据集进行n次过采样,得到n个平衡的数据集;然后基于这n个平衡的数据集利用回归算法训练出n个个体软件缺陷数目预测模型;最后对这n个个体模型进行结合得到一个组合软件缺陷数目预测模型,利用该组合预测模型对新的软件模块的缺陷数目进行预测.实验结果表明SMOTENDEL相比原始的预测方法在性能上有较大提升,当分别利用决策树回归(DTR)、贝叶斯岭回归(BRR)和线性回归(LR)作为个体预测模型时,提升率分别为7.68%、3.31%和3.38%.
Software defect number prediction method based on data oversampling and ensemble learning

简艺恒、余啸

展开 >

北京理工大学信息与电子学院,北京102488

武汉大学计算机学院,武汉430072

软件缺陷预测 数据不平衡 过采样 集成学习

2018

计算机应用
中国科学院成都计算机应用研究所

计算机应用

CSTPCDCSCD北大核心
影响因子:0.892
ISSN:1001-9081
年,卷(期):2018.38(9)
  • 7
  • 6