推荐系统双鲁棒去偏学习模型的研究

苗忠琦¹

扫码查看

作者信息

1. 烟台大学
折叠

摘要

在众多信息检索平台中，推荐系统被广泛应用以满足用户的个性化需求。其中，点击后转化率被认为是评估电商收益的重要指标。当前，双鲁棒学习模型在预测转化率时展现出较高性能。但是，该模型也常面临选择偏差的不利影响，进而导致估计器的偏差和方差过高；另外，受非随机缺失数据的影响，缺失样本在数据集中占比较大。因此，填充预测模型容易对训练样本产生过度依赖；此外，传统方法采用的两阶段更新算法也会增加预测模型的计算复杂度。针对上述问题，文章对传统的双鲁棒学习模型进行以下改进：（1）在选择偏差场景下，提出更稳定的双鲁棒估计器。该估计器通过调整训练样本的倾向权重，缩小点击样本和全局样本的分布差异；在参数更新过程中，提出更具鲁棒性的交替学习模型，将回归预测问题简化为二分类预测问题。以此，提升插值伪标签和倾向分数的预测精度，进而降低估计器的方差影响；另外，所提模型改进双向学习策略为交替更新算法，转而在一阶段内交换转化率预测模型、点击率预测模型和填充预测模型的梯度信号，进而降低参数学习的复杂程度。（2）基于模型参数的迁移学习思想，提出更具鲁棒性的循环学习模型。在参数更新的最初阶段，填充预测模型利用源数据样本进行预训练，并学习模型的先验参数。随后，在目标任务中，该模型利用已获取的先验参数初始化目标函数，进而调整自身参数的更新方向。由此，插值伪标签的预测精度得以提升，预测模型对训练样本的过度依赖得以缓解。

关键词

推荐系统/双鲁棒学习模型/选择偏差/迁移学习

引用本文复制引用

授予学位

硕士

学科专业

计算机技术

导师

童向荣

学位年度

2024

学位授予单位

烟台大学

语种

中文

中图分类号

段落导航