计算机研究与发展2023,Vol.60Issue(7) :1467-1488.DOI:10.7544/issn1000-1239.202221046

开源软件缺陷预测方法综述

Survey of Open-Source Software Defect Prediction Method

田笑 常继友 张弛 荣景峰 王子昱 张光华 王鹤 伍高飞 胡敬炉 张玉清
计算机研究与发展2023,Vol.60Issue(7) :1467-1488.DOI:10.7544/issn1000-1239.202221046

开源软件缺陷预测方法综述

Survey of Open-Source Software Defect Prediction Method

田笑 1常继友 2张弛 3荣景峰 4王子昱 2张光华 2王鹤 1伍高飞 5胡敬炉 6张玉清7
扫码查看

作者信息

  • 1. 西安电子科技大学网络与信息安全学院 西安 710126;国家计算机网络入侵防范中心(中国科学院大学) 北京 101408
  • 2. 河北科技大学信息科学与工程学院 石家庄 050018
  • 3. 国家计算机网络入侵防范中心(中国科学院大学) 北京 101408
  • 4. 国家计算机网络入侵防范中心(中国科学院大学) 北京 101408;海南大学网络空间安全学院 海口 570228
  • 5. 西安电子科技大学网络与信息安全学院 西安 710126;国家计算机网络入侵防范中心(中国科学院大学) 北京 101408;广西密码学与信息安全重点实验室(桂林电子科技大学) 广西桂林 541000
  • 6. 早稻田大学情报生产系统研究科 日本 808-0135
  • 7. 西安电子科技大学网络与信息安全学院 西安 710126;国家计算机网络入侵防范中心(中国科学院大学) 北京 101408;海南大学网络空间安全学院 海口 570228;中关村实验室 北京 100094
  • 折叠

摘要

开源软件缺陷预测通过挖掘软件历史仓库的数据,利用与软件缺陷相关的度量元或源代码本身的语法语义特征,借助机器学习或深度学习方法提前发现软件缺陷,从而减少软件修复成本并提高产品质量.漏洞预测则通过挖掘软件实例存储库来提取和标记代码模块,预测新的代码实例是否含有漏洞,减少漏洞发现和修复的成本.通过对 2000年至 2022年 12月软件缺陷预测研究领域的相关文献调研,以机器学习和深度学习为切入点,梳理了基于软件度量和基于语法语义的预测模型.基于这 2类模型,分析了软件缺陷预测和漏洞预测之间的区别和联系,并针对数据集来源与处理、代码向量的表征方法、预训练模型的提高、深度学习模型的探索、细粒度预测技术、软件缺陷预测和漏洞预测模型迁移六大前沿热点问题进行了详尽分析,最后指出了软件缺陷预测未来的发展方向.

关键词

软件缺陷预测/漏洞预测/机器学习/深度学习/度量元/语法语义分析

引用本文复制引用

基金项目

先进密码技术与系统安全四川省重点实验室开放课题(SKLACSS-202205)

海南省重点研发计划(GHYF2022010)

海南省重点研发计划(ZDYF202012)

国家自然科学基金(U1836210)

陕西省自然科学基础研究计划(2021JQ-192)

广西密码学与信息安全重点实验室课题(GCIS202123)

出版年

2023
计算机研究与发展
中国科学院计算技术研究所 中国计算机学会

计算机研究与发展

CSTPCDCSCD北大核心
影响因子:2.649
ISSN:1000-1239
参考文献量7
段落导航相关论文