计算机研究与发展2021,Vol.58Issue(7) :1385-1394.DOI:10.7544/issn1000-1239.2021.20200817

基于主题与情感联合预训练的虚假评论检测方法

Fake Review Detection Based on Joint Topic and Sentiment Pre-Training Model

张东杰 黄龙涛 张荣 薛晖 林俊宇 路瑶
计算机研究与发展2021,Vol.58Issue(7) :1385-1394.DOI:10.7544/issn1000-1239.2021.20200817

基于主题与情感联合预训练的虚假评论检测方法

Fake Review Detection Based on Joint Topic and Sentiment Pre-Training Model

张东杰 1黄龙涛 1张荣 1薛晖 1林俊宇 2路瑶3
扫码查看

作者信息

  • 1. 阿里巴巴集团 北京 100102
  • 2. 中国科学院信息工程研究所 北京 100093
  • 3. 廊坊职业技术学院 河北廊坊 065001
  • 折叠

摘要

商品评论信息是用户线上决策的重要依据,但在利益的驱使下商家往往会通过雇佣专业的写手撰写大量虚假评论的方式来误导用户,进而达到包装自己或诋毁竞争对手的 目的.这种现象会造成不正当的商业竞争和极差的用户体验.针对这一现象,我们通过情感预训练的方法对现有的虚假评论识别模型进行了改进,并提出了一种能够同时整合评论语义和情感信息的联合预训练学习方法.鉴于预训练模型强大的语义表示能力,在联合学习框架中采用了 2种预训练模型编码器分别用于抽取评论的语义和情感上下文特征,并通过联合训练的方法整合2种特征,最后使用Center Loss损失函数对模型进行优化.在多个公开数据集和多个不同任务上进行了验证实验,实验表明提出的联合模型在虚假评论检测与情感极性分析任务上都取得了 目前最好的效果且具有更强的泛化能力.

关键词

虚假评论检测/预训练模型/情感分析/联合训练/Center/Loss

引用本文复制引用

基金项目

出版年

2021
计算机研究与发展
中国科学院计算技术研究所 中国计算机学会

计算机研究与发展

CSTPCDCSCD北大核心
影响因子:2.649
ISSN:1000-1239
被引量3
参考文献量4
段落导航相关论文