计算机应用研究2021,Vol.38Issue(5) :1403-1408.DOI:10.19734/j.issn.1001-3695.2020.06.0129

基于主观倾向值和EasyEnsemble算法的虚假评论识别方法

Detection of spam reviews based on subjectivity and EasyEnsemble algorithm

陶朝杰 杨进
计算机应用研究2021,Vol.38Issue(5) :1403-1408.DOI:10.19734/j.issn.1001-3695.2020.06.0129

基于主观倾向值和EasyEnsemble算法的虚假评论识别方法

Detection of spam reviews based on subjectivity and EasyEnsemble algorithm

陶朝杰 1杨进1
扫码查看

作者信息

  • 1. 上海理工大学理学院,上海200093
  • 折叠

摘要

为了有效识别在线虚假评论,提出一种基于XGBoost-EasyEnsemble算法的虚假评论识别方法.首先,根据虚假评论的特点和提出的主观倾向值计算方法,建立多维特征模型;其次,针对评论数据中的类别不平衡问题,EasyEnsemble算法借助集成策略弥补欠采样的缺陷,充分利用样本信息;最后,选择“好而不同”的XGBoost模型作为基分类器训练最终分类器.基于Yelp网站上的评论数据,以AUC作为评价指标,与支持向量机、GBDT、神经网络等热门机器学习算法进行对比,验证了该方法的有效性.

关键词

虚假评论/类别不平衡/主观倾向值/EasyEnsemble/XGBoost

引用本文复制引用

基金项目

国家教育部人文社科规划基金资助项目(16YJA630037)

上海市一流学科建设项目(S1201YLXK)

出版年

2021
计算机应用研究
四川省电子计算机应用研究中心

计算机应用研究

CSTPCDCSCD北大核心
影响因子:0.93
ISSN:1001-3695
被引量1
参考文献量4
段落导航相关论文