计算机工程与设计2024,Vol.45Issue(9) :2584-2590.DOI:10.16208/j.issn1000-7024.2024.09.004

基于语义增强的网络安全实体识别

Network security entity recognition based on semantic enhancement

林宏刚 赵航宇 陈麟
计算机工程与设计2024,Vol.45Issue(9) :2584-2590.DOI:10.16208/j.issn1000-7024.2024.09.004

基于语义增强的网络安全实体识别

Network security entity recognition based on semantic enhancement

林宏刚 1赵航宇 1陈麟2
扫码查看

作者信息

  • 1. 成都信息工程大学网络空间安全学院,四川成都 610225;成都信息工程大学先进密码技术与系统安全四川省重点实验室,四川成都 610225
  • 2. 国防科技大学网络空间安全态势感知与评估安徽省重点实验室,安徽合肥 230037
  • 折叠

摘要

从大规模、异构和非结构化的网络空间安全信息文本中识别网络安全实体时,因为实体高频变化和随机性强的特点,导致容易出现实体稀疏的问题,为此提出一种基于语义增强的网络安全实体识别模型.从多维语言学特征增强和语料增强两个方面获取语义增强输入矩阵;利用双向长短记忆网络获取输入矩阵的上下文特征;基于注意力机制对输出的特征生成注意力分配系数,用前馈神经网络聚合和编码来自不同空间的特征;使用条件随机场计算生成最优实体识别序列.实验结果表明,该模型对网络安全实体进行识别,结果显著优于通用领域实体识别模型;与其它网络安全实体识别模型相比较,该模型能得到更好的效果.

Abstract

To solve the problem of entity sparsity when identifying cybersecurity entities from large-scale,heterogeneous and unstructured cyberspace security information texts due to high-frequency changes and strong randomness,a semantic enhance-ment-based cybersecurity entity recognition model was proposed.The semantic enhancement input matrix was obtained from both multidimensional linguistic feature enhancement and corpus enhancement.The BiLSTM was used to obtain the contextual features of the fused input matrix.Attention allocation coefficients for the output features were generated based on the attention mechanism and features from different spaces were aggregated and encoded using FFNN.The optimal entity recognition sequence was generated using CRF computation.Experimental results show that the model outperforms the generic domain entity recogni-tion model significantly.Compared with other cybersecurity entity recognition models,the model can get better results.

关键词

网络安全/网络威胁情报/实体识别/自然语言处理/预训练/语义增强/注意力机制

Key words

network security/cyber threat intelligence/entity recognition/natural language processing/pre-training/semantic enhancement/attention mechanism

引用本文复制引用

基金项目

国家242信息安全计划基金项目(2021-037)

网络空间安全态势感知与评估安徽省重点实验室开放课题基金项目(CSSAE-2021-002)

出版年

2024
计算机工程与设计
中国航天科工集团二院706所

计算机工程与设计

CSTPCD北大核心
影响因子:0.617
ISSN:1000-7024
参考文献量2
段落导航相关论文