摘要
软件缺陷预测是一种利用机器学习技术自动识别软件中潜在缺陷的方法.与单一分类器相比,集成学习方法在软件缺陷预测的预测性能上表现出显著的优势.然而,以往的研究在软件缺陷预测中普遍采用集成模型,并使用其默认的超参数设置,这通常被视为次优选择.对此,提出了一种基于调优树的软件缺陷预测堆叠集成模型.对基于树的四种集成模型(随机森林、极度随机树、自适应提升和极致梯度提升)的超参数进行了网格搜索优化,随后将这些调优后的树类模型作为基分类器,通过堆叠的方式构建集成模型.实验结果表明,基于调优树的堆叠集成方法可以在F1 值和AUC值两个度量上提升模型的预测性能.
基金项目
山西省教育厅高等学校科技创新项目(2022L621)
山西科技学院校内科研基金项目(XKY002)
山西科技学院校内科研基金项目(XKY024)