首页|基于联邦学习的恶意软件识别及其安全性研究

基于联邦学习的恶意软件识别及其安全性研究

扫码查看
人工智能模型通过大量的数据集来提升训练性能。而不同的数据在不同的应用中具有不同的价值。对于企业来说,恶意软件识别模型的开发对行业具有指导价值。然而,随着科技的发展,国家政府和公民越来越关注数据安全和隐私问题,因此恶意软件识别技术在一定程度上受到了数据模型和现有知识的限制,导致出现了“数据孤岛”的问题。传统的恶意软件检测模型通常使用文本或行为特征分析的方法,但效率低、误报率高,还存在安全性的风险。 在这篇文章中,针对恶意软件识别性能、数据隐私保护及安全性展开了深入的研究。本文提出了一种基于联邦学习的恶意软件识别算法,即通过应用联邦学习和恶意软件可视化技术来识别恶意软件。每个企业作为一个客户端,只通过传递参数来共享模型,并采用横向联邦学习的Fedavg算法进行训练。在此过程中,客户端使用CNN模型对恶意软件的灰度图像进行卷积训练。相比传统的恶意软件识别方法,该算法准确率更高,而且与集中式训练方法相比,具有更高的隐私性和安全性。 此外,在基于联邦学习的恶意软件识别实际应用中,联邦学习拥有数以万计的用户,并存在恶意用户,由于联邦学习的工作机制,该应用易受到攻击。目前的后门攻击方案需要多轮后门训练才能使后门模型收敛,导致额外的计算开销,且触发器容易被检测和重构,从而影响了后门攻击的效果。本文提出了一种基于生成式对抗网络的分布式后门攻击方案,相比传统的中毒攻击,这种后门攻击具有更强的隐蔽性和灵活性,并且对当前的研究模型及联邦学习具有普适性。该方法选取指定标签数据作为目标数据,将目标数据的图像特征应用于原始数据,通过生成的数据在特征上趋向于目标数据,使模型将这些生成数据识别为目标数据的标签类别。该方法具有很高的隐蔽性,同时也提高了后门攻击的成功率和收敛速度,为基于联邦学习恶意软件识别的应用提出了潜在的安全隐患。 总之,本研究对于恶意软件识别性能、数据隐私保护及安全性方面有了重要的突破,为实现更加安全和高效的恶意软件检测提供了新的思路。

韩霖

展开 >

联邦学习 恶意软件识别 生成式对抗网络 后门攻击

硕士

软件工程

王巍;贺劼

2023

哈尔滨工程大学

中文

TP