首页|基于机器学习的用户购买行为预测研究

基于机器学习的用户购买行为预测研究

王子涵

基于机器学习的用户购买行为预测研究

王子涵1
扫码查看

作者信息

  • 1. 中国科学院大学
  • 折叠

摘要

随着互联网的迅速发展,大数据时代的到来,各大电商平台的崛起,已经积累了超大量级的用户行为数据,如何更好的利用这些数据完成用户行为分析,更精准的进行个性化推荐以及针对性的营销策略,显得至关重要。现在平台所呈现的用户行为数据大多数不能直观的给到商家及平台想要了解的信息,需要通过数据挖掘等方法手段来透过数据看到行为背后透露的信息,为商家及平台进一步的精准营销提供依据,在降低公司广告及运营成本的基础上实现精准推荐。本文以阿里天池中脱敏的用户行为数据集为基础,借助数据分析手段和机器学习相关算法,通过分析用户的行为,来对用户未来的行为类型进行预测,并选择准确度最高的模型方法。 本文先对用户购买行为的影响因素以及机器学习相关方面研究进行了梳理,总结了前人的研究方法及内容,吸取了经验并分析不足后,提出本文的研究内容及研究方法。本文不仅仅研究用户的单一购买行为,同时对可能产生购买的前期行为,具体表现为点击、收藏、加入购物车行为进行研究,将用户行为预测问题转化为机器学习四分类问题。随后进入到数据准备阶段,先是进行了数据源的介绍,然后进行了数据清洗及数据简单分析。在对数据进行探索性分析后,数据集一些较为显著的特征被捕捉到,为下一步特征工程的构建奠定了基础。最后,结合观察到的特征以及实际情况,本文从用户、商品、商品品类三个方面共建立了5个特征群(3个基础特征群及2个交叉特征群),26个特征。将数据集按照4∶1进行训练集与测试集的划分,同时将特征工程输入要建立的模型,分别是支持向量机、随机森林算法和梯度提升树算法进行用户行为预测,三个模型的准确度分别为0.937、0.913、0.941。同时对随机森林算法和梯度提升树模型中各个特征的重要性进行分析,总结提取影响消费者用户行为的因素群。最后对三种模型的结果进行对比得出,在用户行为预测方面,使用梯度提升树(GB DT)算法是最适用于本文研究内容的预测模型。 从本文的研究中可以发现,在实际电商场景中,可以利用机器学习对用户行为做出预测,再针对不同用户行为采取不同的营销手段,从而提升购买转化率,使企业达到提升收入的目的。

关键词

电商平台/用户群体/行为预测/机器学习

引用本文复制引用

授予学位

硕士

学科专业

工商管理

导师

许健;王璐

学位年度

2022

学位授予单位

中国科学院大学

语种

中文

中图分类号

F7
段落导航相关论文