计算机科学2021,Vol.48Issue(12) :131-139.DOI:10.11896/jsjkx.201000168

噪声可容忍的软件缺陷预测特征选择方法

Noise Tolerable Feature Selection Method for Software Defect Prediction

滕俊元 高猛 郑小萌 江云松
计算机科学2021,Vol.48Issue(12) :131-139.DOI:10.11896/jsjkx.201000168

噪声可容忍的软件缺陷预测特征选择方法

Noise Tolerable Feature Selection Method for Software Defect Prediction

滕俊元 1高猛 1郑小萌 1江云松1
扫码查看

作者信息

  • 1. 北京控制工程研究所 北京 100190
  • 折叠

摘要

通过对缺陷数据集进行挖掘,缺陷预测模型能够提前预测出被测软件中的缺陷模块,帮助测试人员实现更有针对性的测试,而普遍存在的数据集标签噪声会影响预测模型的性能.已有的特征选择方法很少对噪声可容忍性进行针对性设计,同时在主流的具有噪声容忍能力的特征选择框架中策略选取只能依靠经验手动执行,难以在软件工程实践中得到应用.鉴于此,文中提出一种噪声可容忍的软件缺陷预测特征选择方法NTFES(Noise Tolerable FEature Selection),即通过Bootstrap抽样技术生成多个自助样本集,在自助样本集上基于近似马尔可夫毯将特征进行分组并采用两种启发式特征选择策略从每个组中选出候选特征,随后利用遗传算法在候选特征空间中搜索最优特征子集.为了验证NTFES方法的有效性,选择了NASA MDP软件项目集作为实验对象并对标签注入噪声以获得带有噪声标签的数据集,通过控制标签噪声比例对NTFES方法以及其他基准方法(如FULL,FCBF,CFS)进行了比较.实验结果表明:在可接受的标签噪声比例下,NTFES方法不仅具有更高的分类性能,还具有更好的噪声可容忍性.

关键词

软件测试/软件缺陷预测/特征选择/标签噪声/噪声可容忍

引用本文复制引用

基金项目

国家自然科学基金(61802017)

装备预研领域基金(61400020407)

出版年

2021
计算机科学
重庆西南信息有限公司(原科技部西南信息中心)

计算机科学

CSTPCDCSCD北大核心
影响因子:0.944
ISSN:1002-137X
被引量4
参考文献量3
段落导航相关论文