为解决赌博网站域名更新频繁、流量分析难、规避风险能力强问题,提出一种基于特征融合的赌博网站识别方法。该方法首先获取了网站首页截图数据和HTML文本数据,提升网站数据的利用率;随后,对网站截图和HTML文本数据特征进行融合,利用Bert模型进行预训练,提取 764 维特征向量;最后,将获得的特征向量输入到Bert模型进行分类检测。实验结果表明:基于特征融合的赌博网站识别方法达到较好的检测效果,其准确率、精确率、召回率、F1 值分别为 95。33%,97。56%,96。13%,96。84%,相比GRU、LSTM、RNN识别方法具有更好的识别性能,有效提升了赌博网站的识别准确性。