首页|基于深度学习的代码漏洞挖掘方法研究

基于深度学习的代码漏洞挖掘方法研究

周佳睿

基于深度学习的代码漏洞挖掘方法研究

周佳睿1
扫码查看

作者信息

  • 1. 哈尔滨工程大学
  • 折叠

摘要

在数字化技术急速发展的时代背景下,软件安全防护已成为企业和个人必须面对的现实问题。然而,由于软件系统的规模与复杂程度不断提高,传统漏洞挖掘方法已经逐渐失去其优势地位。与此同时,现有漏洞挖掘方法也因存在高漏报率或高误报率等问题而无法满足越来越严苛的安全需求。据此,在分析现有漏洞挖掘方法缺点的基础上,以深度学习框架为基础,从漏洞挖掘数据集平衡方法、漏洞挖掘模型设计两个方面展开研究,主要工作如下: 首先,针对漏洞挖掘数据集数据不均衡问题,提出一种漏洞数据集平衡方法IKMSMOTE,对少数类样本进行增强。IKMSMOTE使用K-means++算法作为聚类算法,并联合手肘法、轮廓系数法和CH指标法三种方法确定最佳聚类数,从而获得更好的数据集平衡效果。该方法可以在数据集样本空间中生成优质少数类样本,且有效避免产生不必要噪声或样本重叠等情况。将IKMSMOTE方法应用于漏洞挖掘方向,可以有效平衡数据集中两类样本(有漏洞和无漏洞)的占比,改善漏洞挖掘研究中模型过度拟合的问题,增加模型对于漏洞样本的分类准确率,从而提高漏洞挖掘模型的整体效果。 其次,提出了一种基于改进BGRU的漏洞挖掘模型TCBiAGRU,综合考虑漏报率、误报率等指标来应对软件代码漏洞挖掘的复杂性、动态性问题。TCBiAGRU使用TextCNN与BiGRU进行特征提取,综合考虑输入信息的局部特征与全局特征,并结合Self-Attention机制,旨在提高漏洞挖掘模型的实用性及有效性。实验结果显示,优化后的模型能够更加符合漏洞挖掘的实际应用环境,更加高效、准确地预测代码漏洞。

关键词

软件代码/漏洞挖掘/数据集/深度学习

引用本文复制引用

授予学位

硕士

学科专业

软件工程

导师

吕宏武/贺劼

学位年度

2023

学位授予单位

哈尔滨工程大学

语种

中文

中图分类号

TP
段落导航相关论文