首页|在线课程销量影响因素分析及预测——以IMOOC平台付费课程为例

在线课程销量影响因素分析及预测——以IMOOC平台付费课程为例

胡云飘

在线课程销量影响因素分析及预测——以IMOOC平台付费课程为例

胡云飘1
扫码查看

作者信息

  • 1. 河北经贸大学
  • 折叠

摘要

中国的教育市场不断发展,特别是在线教育行业,但在发展过程中机遇伴随着挑战并存,特别是一些提供付费课程的平台,平台课程众多,还有其他平台竞争,如何留住学习者是平台健康发展的关键所在。每个平台都在关心什么课程能吸引学习者为此付费,学习者再付费时通常会考虑什么?基于此,本文研究了课程信息的哪些变量会影响课程的销量,并对一些课程的销量进行了预测。文章以IMOOC平台为例,与以往通过问卷调查获取样本不同,本文运用爬虫方法获取课程信息,在对爬取下来的课程信息进行清洗并对某些文本变量转变为数值变量后,建立了逐步回归模型和随机森林算法模型筛选出来8个影响课程学习人数的变量,并根据模型结果对8个变量进行了简要分析。回归模型结果表明对学习人数影响最大的是课程评论人数,其次是课前咨询人数和课程价格。课程评论人数、课前咨询人数、平均浏览人数、计算机基础类对课程学习人数有正向影响。价格和课程热词对课程学习人数有负向影响;随机森林算法模型结果同样显示课前咨询人数对课程学习人数有较大影响,并且课程时长、课程详细介绍热词、课时数也影响课程学习人数。在对课程学习人数进行预测时,首先进行了数值预测,K近邻预测平均误差为39.88%,随机森林平均误差为25.2%,GBDT预测平均误差为18.7%,模型误差不低但较其他两种方法来说较好,可能是某些课程预测结果不准确导致的,对10门课程进行了数值预测,同样三种方法中 GBDT 预测相对较好,且预测误差较小;将学习人数进行分类预测, XGBoost 模型在测试集上准确率为 89.2%,较其他两种预测方法预测准确率较高,同时也对10门课程进行预测,结果较好。最后将二者对10门课程的预测进行了对比,有些课程的分类预测和数值预测结果一致,有些不太一致被分在了相邻的区间但数值预测人数相差很小。平台可以将两种预测方法结合到一起,对课程学习人数进行预测。若数值预测的结果所属的区间和分类预测的区间一致,则还可以判断学习人数属于区间的前半段还是后半段,后期也可以调整课程的价格,计算销售额区间,高区间内对应的价格可作为定价参考,对应的学习人数可作为课程销量参考,平台以此调整课程的设置和内容。

关键词

在线学习/MOOC平台/销量预测/付费课程

引用本文复制引用

授予学位

硕士

学科专业

应用统计

导师

耿娟

学位年度

2021

学位授予单位

河北经贸大学

语种

中文

中图分类号

G4
段落导航相关论文