开源软件缺陷预测方法综述

Survey of Open-Source Software Defect Prediction Method

田笑 ¹常继友 ²张弛 ³荣景峰 ⁴王子昱 ²张光华 ²王鹤 ¹伍高飞 ⁵胡敬炉 ⁶张玉清⁷

扫码查看

作者信息

1. 西安电子科技大学网络与信息安全学院西安 710126;国家计算机网络入侵防范中心(中国科学院大学) 北京 101408
2. 河北科技大学信息科学与工程学院石家庄 050018
3. 国家计算机网络入侵防范中心(中国科学院大学) 北京 101408
4. 国家计算机网络入侵防范中心(中国科学院大学) 北京 101408;海南大学网络空间安全学院海口 570228
5. 西安电子科技大学网络与信息安全学院西安 710126;国家计算机网络入侵防范中心(中国科学院大学) 北京 101408;广西密码学与信息安全重点实验室(桂林电子科技大学) 广西桂林 541000
6. 早稻田大学情报生产系统研究科日本 808-0135
7. 西安电子科技大学网络与信息安全学院西安 710126;国家计算机网络入侵防范中心(中国科学院大学) 北京 101408;海南大学网络空间安全学院海口 570228;中关村实验室北京 100094
折叠

摘要

开源软件缺陷预测通过挖掘软件历史仓库的数据,利用与软件缺陷相关的度量元或源代码本身的语法语义特征,借助机器学习或深度学习方法提前发现软件缺陷,从而减少软件修复成本并提高产品质量.漏洞预测则通过挖掘软件实例存储库来提取和标记代码模块,预测新的代码实例是否含有漏洞,减少漏洞发现和修复的成本.通过对 2000年至 2022年 12月软件缺陷预测研究领域的相关文献调研,以机器学习和深度学习为切入点,梳理了基于软件度量和基于语法语义的预测模型.基于这 2类模型,分析了软件缺陷预测和漏洞预测之间的区别和联系,并针对数据集来源与处理、代码向量的表征方法、预训练模型的提高、深度学习模型的探索、细粒度预测技术、软件缺陷预测和漏洞预测模型迁移六大前沿热点问题进行了详尽分析,最后指出了软件缺陷预测未来的发展方向.

关键词

软件缺陷预测/漏洞预测/机器学习/深度学习/度量元/语法语义分析

引用本文复制引用

基金项目

先进密码技术与系统安全四川省重点实验室开放课题(SKLACSS-202205)

海南省重点研发计划(GHYF2022010)

海南省重点研发计划(ZDYF202012)

国家自然科学基金(U1836210)

陕西省自然科学基础研究计划(2021JQ-192)

广西密码学与信息安全重点实验室课题(GCIS202123)

出版年

2023

计算机研究与发展

中国科学院计算技术研究所中国计算机学会

计算机研究与发展

CSTPCDCSCD北大核心

影响因子：2.649

ISSN：1000-1239

参考文献量7

段落导航