首页|好评返现商家的识别及其特征分析

好评返现商家的识别及其特征分析

郭丰杰

好评返现商家的识别及其特征分析

郭丰杰1
扫码查看

作者信息

  • 1. 贵州大学
  • 折叠

摘要

在当前电子商务蓬勃发展的背景下,销售量和用户评价在消费者购物决策中扮演着至关重要的角色。为吸引更多顾客并提升销售额,许多商家纷纷采用好评返现策略,这一策略已显著影响了消费者对购物产品的评判标准。为了探讨好评返现商家的可疑性、改善在线购物环境并提升顾客购物体验,有必要深入研究商家评论的真实性以及商业行为。 首先,为确保数据集的可靠性,大量的调查从淘宝平台商品购物的包裹里是否有“好评返现卡”,以此来断定此商家是否具有好评返现的嫌疑。最终利用网络爬虫技术在淘宝平台上获取了17个不同商品的评论数据,并针对评论数据做预处理及标注。每个商品仅归属于一个商家,其中有7个商家存在好评返现嫌疑,而其余10个则暂未发现嫌疑。这两种商家的评论样本比例接近1:1。 其次,通过对评论样本进行文本特征提取,包括情感极性、TF-IDF和词袋等特征;使用CDF对一维特征在两类评论中的分布差异提供直观认识;使用PCA对高维特征降维后,通过分类实验表现选择最佳主成分;为了消除不同特征之间由于量纲不同而可能引起的偏差,对特征进行标准化。 随后,采用K-fold实验以避免数据集不平衡的问题,对各种分类模型进行训练和测试。测试结果中,将每个商家的评论为好评返现类型的比例作为该商家属于好评返现类型的概率,并通过AUC值评估模型性能以选取最佳分类模型。对不同特征的分类结果进行特征分析。 最后,采用线性支持向量机计算判断好评返现商家类型的阈值以识别好评返现商家。通过精确率(Precision)、召回率(Recall)和F1值等评估指标全面评估模型性能。实验结果表明,随机森林分类模型在数据集分类方面表现显著,其AUC值最高可达98%。当一个商家的评论中好评返现的比例超过52%时,可认定该商家为好评返现类型。最终,综合评估标准平均值显示精确率为0.97,召回率为0.78,F1值为0.85。因此,该模型呈现出卓越的性能。

关键词

电子商务/好评返现/商家识别/特征分析

引用本文复制引用

授予学位

硕士

学科专业

计算机技术

导师

王琢

学位年度

2024

学位授予单位

沈阳理工大学

语种

中文

中图分类号

TP
段落导航相关论文