首页|推荐系统双鲁棒去偏学习模型的研究

推荐系统双鲁棒去偏学习模型的研究

苗忠琦

推荐系统双鲁棒去偏学习模型的研究

苗忠琦1
扫码查看

作者信息

  • 1. 烟台大学
  • 折叠

摘要

在众多信息检索平台中,推荐系统被广泛应用以满足用户的个性化需求。其中,点击后转化率被认为是评估电商收益的重要指标。当前,双鲁棒学习模型在预测转化率时展现出较高性能。但是,该模型也常面临选择偏差的不利影响,进而导致估计器的偏差和方差过高;另外,受非随机缺失数据的影响,缺失样本在数据集中占比较大。因此,填充预测模型容易对训练样本产生过度依赖;此外,传统方法采用的两阶段更新算法也会增加预测模型的计算复杂度。针对上述问题,文章对传统的双鲁棒学习模型进行以下改进: (1)在选择偏差场景下,提出更稳定的双鲁棒估计器。该估计器通过调整训练样本的倾向权重,缩小点击样本和全局样本的分布差异;在参数更新过程中,提出更具鲁棒性的交替学习模型,将回归预测问题简化为二分类预测问题。以此,提升插值伪标签和倾向分数的预测精度,进而降低估计器的方差影响;另外,所提模型改进双向学习策略为交替更新算法,转而在一阶段内交换转化率预测模型、点击率预测模型和填充预测模型的梯度信号,进而降低参数学习的复杂程度。 (2)基于模型参数的迁移学习思想,提出更具鲁棒性的循环学习模型。在参数更新的最初阶段,填充预测模型利用源数据样本进行预训练,并学习模型的先验参数。随后,在目标任务中,该模型利用已获取的先验参数初始化目标函数,进而调整自身参数的更新方向。由此,插值伪标签的预测精度得以提升,预测模型对训练样本的过度依赖得以缓解。

关键词

推荐系统/双鲁棒学习模型/选择偏差/迁移学习

引用本文复制引用

授予学位

硕士

学科专业

计算机技术

导师

童向荣

学位年度

2024

学位授予单位

烟台大学

语种

中文

中图分类号

TP
段落导航相关论文