首页|一种基于特征提取和Stacking集成学习的软件缺陷预测方法

一种基于特征提取和Stacking集成学习的软件缺陷预测方法

扫码查看
本发明公开了一种基于特征提取和Stacking集成学习的软件缺陷预测方法,包括:(1)利用核主成分分析对原始数据集进行特征提取,得到降维后的缺陷数据集DS′;(2)利用本发明提出的协同过滤算法为新的软件缺陷数据推荐适用的抽样方法,使用推荐的抽样算法在缺陷数据集DS′上进行不平衡处理,得到不平衡处理后的缺陷数据集DS″;(3)使用K?Means算法对缺陷数据集DS″进行聚类,对于偏离主流类别的异常值进行剔除,得到缺陷数据集DS″′;(4)构建基于Stacking集成学习的软件缺陷预测模型,为第一层的基学习器和第二层的元学习器选择合适的分类器,构建出性能良好的软件缺陷预测模型;(5)在处理后的缺陷数据集DS″′上使用集成后的模型与基模型和主流集成模型进行对比,以此验证本发明提出的集成预测模型的性能优劣。研究结果表明,本发明提出的KSSDP集成预测模型比基模型和主流集成模型的性能更好。

CN202111106611.0

CN113837266B

发明专利

2021-09-22

2022-05-20

G06K9/62(2022.01)

西南民族大学

王琳、吴克奇、李卫榜、崔梦天、姜玥、罗洪

610000 四川省成都市武侯区一环路南四段16号

中国(CN)