首页|基于BERT的垃圾邮件分类的同义词替换攻击研究

基于BERT的垃圾邮件分类的同义词替换攻击研究

扫码查看
电子邮件在办公应用中有其独特的优势,但电子邮件在应用过程中也被一些人通过广告邮件推送的方式进行牟利,这些广告邮件也称为垃圾邮件.为了阻断垃圾邮件,邮箱管理者经常采用垃圾邮件分类的方法对其进行管理.但垃圾邮件推送者为了绕过邮件分类器,采取了同义词替换攻击的方法.本文通过使用 SMS 垃圾邮件的数据集,进行文本预处理和分类后,建立了根据从数据集中提取 5000 个最常见词语的词汇表,并将它们用作同义词库中的关键词.随后分别使用文本表示模型 BoW、TF-IDF和新的BERT模型,结合SVM、朴素贝叶斯、决策树算法,对同义词替换攻击检测.经比对分析,结果表明BoW和TF-IDF检测率急剧下降,而BERT模型能够抵抗同义词替换攻击.

林小题、秦玉海、于昕彤

展开 >

中国刑事警察学院公安信息技术与情报学院 辽宁 110854

垃圾邮件分类 同义词替换攻击 BERT模型

2024

网络安全技术与应用
北京大学出版社

网络安全技术与应用

CHSSCD
影响因子:0.417
ISSN:1009-6833
年,卷(期):2024.(4)
  • 9