电子元器件与信息技术2024,Vol.8Issue(10) :207-209.DOI:10.19772/j.cnki.2096-4455.2024.10.064

面向不平衡数据的赌博网站识别方法研究

唐灵灵 阳翔 韦庆
电子元器件与信息技术2024,Vol.8Issue(10) :207-209.DOI:10.19772/j.cnki.2096-4455.2024.10.064

面向不平衡数据的赌博网站识别方法研究

唐灵灵 1阳翔 1韦庆1
扫码查看

作者信息

  • 1. 国家计算机网络应急技术处理协调中心广西分中心,广西 南宁,530210
  • 折叠

摘要

赌博网站的识别难点除了本身特征多样、变化丰富外,还面临数据严重不平衡的挑战.数据严重不平衡会降低机器学习算法的性能,造成对少数类的识别率低.因此,需要针对该场景下适用的分类模型进行研究.为了解决上述问题,本文探究了数据层面方法、算法层面方法和集成方法这三类典型的不平衡数据分类问题改进策略在赌博网站识别问题上的性能表现.本文在3个实验数据集上进行了实验,结果表明,各类方法均能明显改善涉赌网站的识别性能,其中提升最大的是SMOTE-SVM,对小类的识别能力提升了38.82%,总体识别能力提升了20.07%.

关键词

赌博网站/不平衡数据/仿真验证

引用本文复制引用

出版年

2024
电子元器件与信息技术

电子元器件与信息技术

ISSN:
段落导航相关论文