首页|数字内容平台用户留存与作品贡献研究

数字内容平台用户留存与作品贡献研究

王羽佳

数字内容平台用户留存与作品贡献研究

王羽佳1
扫码查看

作者信息

  • 1. 复旦大学
  • 折叠

摘要

随着数字内容产业的发展,聚合了大量作品的内容平台成为互联网行业的重要组成部分。但当前大多数平台面临着广告收入大幅下降、内容成本居高不下、付费用户增长乏力、用户平台依赖性差等问题。因此,如何运用统计和数据分析手段,从更丰富的维度研究用户留存规律、衡量采购的作品对平台的贡献,都变得越来越重要。 目前付费内容及会员订阅成为在线平台的主要盈利方式,平台迫切需要对用户留存进行更准确的预测。本文以咪咕动漫APP的用户行为数据作为研究对象,拓展传统特征维度,建立有效的留存预测模型,并探究具体特征对预测结果的影响。首先,结合对用户行为的基础统计分析及对代表性用户的研究,从阅读、付费、追新等多个维度构造17个特征,对于不同的特征组合分别使用逻辑回归以及擅长处理多维度特征和非线性问题的XGBoost算法构建二分类模型,并通过参数调节提高模型效果。实验结果表明,XGBoost在预测效果上明显优于逻辑回归,AUC可以达到0.88,而特征工程中构造的付费特征和追新特征,都对模型AUC有显著提升。结合可解释性机器学习领域的SHAP方法,可以得到XGBoost模型变量重要性的排序,验证了新构建特征的有效性,表明在实际业务中使用此类特征的价值。另外,通过对重点特征样本粒度SHAP value的分析,揭示了特征与留存、特征与特征之间的非线性作用,进一步理解了用户留存的规律。 除了通过留存预测指导用户运营,本文从另一个角度创新性地研究了单部作品对用户留存的贡献,这对于平台进行作品推荐、评估作品优劣都有重要意义。为了在内容聚合模式下分配每部作品的留存贡献,本文从留存用户对作品的参与度、忠诚度两个角度出发,通过对留存用户阅读过的作品赋分,得到作品的留存贡献分数及相应排名。为了提前预测出作品贡献,从阅读、更新等维度构造了 26个作品特征,并搭建了用户阅读作品的网络结构,分别使用无监督的PageRank算法、有监督的线性回归及XGBoost算法构建模型。对比使用作品阅读量排序的基础方法,发现PageRank算法在前5名作品的预测中表现较好,而XGBoost整体优于其他模型,基本保持较基础方法预测误差减小25%以上的提升。此外,结合SHAP方法的分析表明,作品更新天数、免费比例等特征与头部作品的留存贡献有明显的正相关,启示平台可以通过调整作品更新模式、付费模式等手段,最大程度发挥采购作品的价值,培养用户粘性,吸引用户再次回到平台。

关键词

数字内容平台/用户留存/作品贡献

引用本文复制引用

授予学位

硕士

学科专业

应用统计

导师

窦一凡

学位年度

2022

学位授予单位

复旦大学

语种

中文

中图分类号

G1
段落导航相关论文