计算机研究与发展2022,Vol.59Issue(12) :2867-2877.DOI:10.7544/issn1000-1239.20210865

基于相关修正的无偏排序学习方法

Unbiased Learning to Rank Based on Relevance Correction

王奕婷 兰艳艳 庞亮 郭嘉丰 程学旗
计算机研究与发展2022,Vol.59Issue(12) :2867-2877.DOI:10.7544/issn1000-1239.20210865

基于相关修正的无偏排序学习方法

Unbiased Learning to Rank Based on Relevance Correction

王奕婷 1兰艳艳 2庞亮 3郭嘉丰 1程学旗1
扫码查看

作者信息

  • 1. 中国科学院网络数据科学与技术重点实验室(中国科学院计算技术研究所),北京 100190;中国科学院大学,北京 100049
  • 2. 清华大学智能产业研究院,北京 100084
  • 3. 中国科学院大学,北京 100049;中国科学院计算技术研究所数据智能系统研究中心,北京 100190
  • 折叠

摘要

用户点击数据较文档的相关标签更易被获取且能反映用户兴趣,将其作为标签能够有效降低人工标注成本并且模型能随数据实时更新.但用户点击含有偏差和噪声,因此需设计有效的无偏排序方法.针对无偏排序中对偶学习方法收敛得到次优解从而无法完全消除偏差的问题,提出一种基于相关修正的无偏排序学习方法.首先,利用现有小规模相关标注数据训练排序模型,对候选文档进行较精准的相关得分预测;再基于用户点击和文档相关得分训练点击倾向模型;最后,将得到的模型参数设为对偶去偏初始值并联合训练.该方法不影响模型上线的计算速度,可用于在线学习场景,模拟不同程度偏差噪声并在真实点击场景下进行测试,结果表明该方案能够有效提升现有无偏排序学习方法表现.

关键词

无偏排序学习/点击数据/相关修正/偏差去除/逆倾向加权

引用本文复制引用

基金项目

国家重点研发计划(2020AAA0105200)

国家自然科学基金(61773362)

国家自然科学基金(61906180)

出版年

2022
计算机研究与发展
中国科学院计算技术研究所 中国计算机学会

计算机研究与发展

CSTPCDCSCD北大核心
影响因子:2.649
ISSN:1000-1239
被引量1
参考文献量1
段落导航相关论文