计算机应用研究2021,Vol.38Issue(8) :2394-2400.DOI:10.19734/j.issn.1001-3695.2020.10.0367

融合滑动窗口和哈希函数的代码漏洞检测模型

Code vulnerability detection model based on sliding window and hash function

许健 陈平华 熊建斌
计算机应用研究2021,Vol.38Issue(8) :2394-2400.DOI:10.19734/j.issn.1001-3695.2020.10.0367

融合滑动窗口和哈希函数的代码漏洞检测模型

Code vulnerability detection model based on sliding window and hash function

许健 1陈平华 1熊建斌2
扫码查看

作者信息

  • 1. 广东工业大学 计算机学院,广州510006
  • 2. 广东技术师范大学 自动化学院,广州510665
  • 折叠

摘要

针对传统漏洞检测分类需要定义人工特征以及相似度匹配算法不能检测非克隆漏洞、现有深度学习漏洞检测的方法特征维度过大以及只针对函数调用的问题,提出一种融合滑动窗口和哈希函数的深度学习方法,对源代码进行静态漏洞检测分类.首先抽取源代码的方法体,形成正负样本集,对样本集中的每个样本构建抽象语法树,根据语法树中的节点类型替换程序员自定义的变量名以及方法名,并以先序遍历的方式序列化抽象语法树;然后对抽象语法树节点中的节点信息进行分词,为每个词分配一个独立的节点编号;其次对树节点进行进一步的拆分,形成词序列,基于滑动窗口与哈希函数训练出相应的漏洞检测分类模型.最后,在SARD数据集中选取CWE190整数上溢和CWE191整数下溢两类漏洞进行实验,该模型在CWE190、CWE191中的分类准确率和召回率分别达到97.4%、94.2%和97.6%、95.1%.实验结果表明,提出方法能够检测到代码中的安全漏洞类型,并且在分类准确率和召回率上优于现有的方法.

关键词

静态代码漏洞检测/深度学习/滑动窗口/哈希函数/分类模型

引用本文复制引用

基金项目

出版年

2021
计算机应用研究
四川省电子计算机应用研究中心

计算机应用研究

CSTPCDCSCD北大核心
影响因子:0.93
ISSN:1001-3695
被引量6
参考文献量2
段落导航相关论文