首页|基于BalanceCascade-GBDT算法的类别不平衡虚假评论识别方法

基于BalanceCascade-GBDT算法的类别不平衡虚假评论识别方法

扫码查看
虚假评论是电商发展过程中一个无法避免的难题.针对在线评论数据中样本类别不平衡情况,提出基于BalanceCascade-GBDT算法的虚假评论识别方法.BalanceCascade算法通过设置分类器的误报率逐步缩小大类样本空间,然后集成所有基分类器构建最终分类器.GBD T以其高准确性和可解释性被广泛应用于分类问题中,并且作为样本扰动不稳定算法,是十分合适的基分类模型.模型基于Yelp评论数据集,采用AUC值作为评价指标,并与逻辑回归、随机森林以及神经网络算法进行对比,实验证明了该方法的有效性.
Detection of Class-Imbalance Spam Reviews Based on BalanceCascade-GBDT Algorithm

陶朝杰、杨进

展开 >

上海理工大学理学院 ,上海 200093

虚假评论 类别不平衡 GBDT BalanceCascsde 机器学习

教育部人文社科规划基金上海市一流学科建设项目

16YJA630037S1201YLXK

2020

经济数学
湖南大学 湖南省经济数学研究会

经济数学

影响因子:0.614
ISSN:1007-1660
年,卷(期):2020.37(3)
  • 1
  • 3