基于自然语言处理的漏洞检测方法综述

Vulnerability Detection Methods Based on Natural Language Processing

杨伊 ¹李滢 ¹陈恺²

扫码查看

作者信息

1. 信息安全国家重点实验室(中国科学院信息工程研究所),北京 100093;中国科学院大学网络空间安全学院,北京 100049
2. 信息安全国家重点实验室(中国科学院信息工程研究所),北京 100093;中国科学院大学网络空间安全学院,北京 100049;北京智源人工智能研究院,北京 100084
折叠

摘要

随着官方发布的漏洞数量呈现指数的增长趋势,针对漏洞检测技术的研究应运而生.漏洞种类的多样性以及检测方法的单一性导致漏洞检测结果呈现一定的局限性.当前漏洞检测技术主要集中在静态检测和动态检测2方面.其中静态检测分析又分为文档分析法、交叉验证法以及程序分析方法等3类.随着自然语言处理技术的兴起和专家知识的不断扩展,研究人员探索了在多个数据源上利用自然语言处理技术辅助进行漏洞检测研究的可行性.根据信息类型的不同,分别从官方文档、代码、代码注释以及漏洞相关信息4部分内容出发,对基于自然语言处理的漏洞检测相关研究成果进行调研.首先,通过对近10年来基于自然语言处理技术的漏洞检测相关文献进行梳理,对相关成果进行分类并提取技术细节;接着,对不同数据源下的研究成果进行横向对比,总结当前基于自然语言处理技术的漏洞检测成果的优缺点;最后,通过交叉对比并深入分析,总结当前基于自然语言处理的漏洞检测方法中存在的8类问题,从数据、技术以及效果3方面进行解决方案的讨论,同时提出了未来研究方向.

关键词

漏洞检测/自然语言处理/静态检测/安全/综述

引用本文复制引用

基金项目

国家重点研发计划(2020AAA0105200)

国家自然科学基金(U1836211)

北京市自然科学基金(JQ18011)

中国科学院青年创新促进会项目()

北京智源人工智能研究院资助项目(BAAI2020ZJ0402)

出版年

2022

计算机研究与发展

中国科学院计算技术研究所中国计算机学会

计算机研究与发展

CSTPCDCSCD北大核心

影响因子：2.649

ISSN：1000-1239

参考文献量4

段落导航