首页|iAES:面向网络安全博客的IOC自动抽取方法

iAES:面向网络安全博客的IOC自动抽取方法

An Indicator of Compromise Extraction Method Based on Deep Learning

扫码查看
网络威胁指标(IOC)作为网络威胁的行为特征,可以按照标准组织起来并部署在安全系统中防御攻击.博客是重要的网络威胁情报来源,及时从中收集网络威胁指标能够快速应对新的安全威胁,但人工阅读并抽取IOC的方式耗时耗力,所以我们迫切需要一种从网络安全博客中自动抽取IOC的方法.为此,本文提出了一种面向网络安全博客的IOC自动抽取方法iAES(IOC Automatic Extraction System).该方法完成了博客的自动增量爬取、博客页面去噪预处理、结合文本特征和话题特征的博客分类、基于正则表达式匹配和深度学习模型的IOC语句识别、基于上下文语义相似性的IOC格式化.我们通过人工标记的方法建立了博客数据集、语句数据集和IOC数据集,分别对iAES与近期相关研究iACE进行测试,测试结果表明iAES在IOC博客分类、IOC语句分类和安全博客IOC抽取上的表现分别比iACE提升了 9.46%、4.25%和7.11%.进而采用iAES对来自于29个安全博客网站的67 682博文进行测试,并从自动获取的IOC语句中随机选取1000条进行人工验证,结果表明精确率达到94.3%.

王伟平、宁翔凯、宋虹、鲁鸣鸣、王建新

展开 >

中南大学计算机学院 长沙 410083

网络安全 网络威胁指标 深度学习 语句分类 IOC抽取

本课题得到国家自然科学基金

61672543

2021

计算机学报
中国计算机学会 中国科学院计算技术研究所

计算机学报

CSTPCDCSCD北大核心
影响因子:3.18
ISSN:0254-4164
年,卷(期):2021.44(5)
  • 8
  • 30