基于图神经网络的个性化推荐

吴剑灿¹

扫码查看

作者信息

1. 中国科学技术大学
折叠

摘要

随着信息技术和电子商务的发展，互联网已经成为国民日常生活不可或缺的一部分，对国民的生活质量产生极大影响。然而，互联网上的海量信息在丰富人们的生活、满足国民日益增长的物质和精神需求的同时，也对用户个性化筛选信息、平台精准投放信息带来了巨大挑战。个性化推荐系统作为大数据时代缓解“信息过载”问题的有效工具，已经成为了支撑互联网智能、部署实现高端高效智能经济的关键技术之一。个性化推荐的核心之一是发掘用户意图。传统的启发式方法和基于矩阵分解的方法只能建模浅层的、隐式的用户意图，难以显式地捕捉更深层次的用户意图。由于推荐场景下的大部分数据本质上都是图结构的（如用户-物品的交互数据、用户的社交网络、物品的知识图谱等），以及图神经网络在建模高阶复杂关系上展现出的优势，基于图神经网络的个性化推荐受到了研究人员的广泛关注。然而，现有工作存在诸多不足之处。例如，在模型设计层面，现有的图推荐算法对图数据的建模能力较弱，一方面难以充分发挥未标记的交互数据空间的潜能，另一方面无法同时捕捉多源异构数据中的多种交互效应;在优化目标层面，现有的工作往往采用经典的损失函数对模型参数进行优化，缺少对图推荐算法的适配和更深入的理论分析等。针对这些挑战，本论文从模型设计层面和优化目标层面展开研究。具体而言，在模型设计层面，本论文创新性地提出从内源性图数据建模和外源性图数据建模两个方面分别对图推荐算法进行增强;在优化目标层面，本论文对图推荐算法的优化目标进行深入的理论分析。本论文的主要贡献和创新点如下: （一）基于内源性图数据建模的推荐算法:针对现有的采用有监督学习范式的图推荐算法中存在的监督信号稀疏、数据分布偏态和交互数据带噪等问题，本论文研究了在用户-物品二部图上进行自监督学习，通过探索未标记的交互数据空间来解决上述问题。其思想是设置一个辅助的自监督学习任务来补充经典的有监督推荐任务。具体而言，本论文设计了五种数据增广操作来生成节点的多个视图，并最大化同一节点的不同视图之间的一致性。进一步地，本论文从理论上证明了所提出的方法具备自动挖掘难负样本的优势。在公开数据集上的实验表明，所提出的方法在经典的推荐任务和长尾推荐任务中均显著优于主流方法，并且其训练效率和抗噪声能力也有明显提升。（二）基于外源性图数据建模的推荐算法:针对推荐系统中涉及的多源异构数据以及现有的场景感知图推荐方法无法同时捕捉多种交互效应等方面的不足，本论文首先提出利用图结构来组织用户、物品和情境特征，生成带属性的交互二部图，其中情境特征被建模为二部图中相应连边的特征。然后，设计了一个新的通用推荐系统框架，借助图卷积层模块和解码器模块来建模高阶协同效应和特征交叉模式，从而生成用户在特点情境下交互目标物品的评分预测。在真实数据集上的实验表明，所提出的方法相比于现有方法具有显著的性能提升，同时有望缓解物品冷启动问题。（三）面向图推荐方法的优化目标:针对现有优化目标函数存在的与推荐目标不一致、放大流行度偏差、训练效率不高等问题，本论文从噪声对比估计(Noise Contrastive Estimation，NCE)的角度重新定义了采样软最大化(Sampled Softmax，SSM)损失函数，并从理论上证明了SSM损失函数具备三点优势:(a)缓解流行度偏差，(b)自动挖掘难负样本，以及(c)最大化折损累计增益(Discounted Cumulative Gain，DCG)指标。此外，本论文还发现了SSM损失函数在学习表示向量(Representation)的模长(Magnitude)方面存在潜在不足，并证明了图卷积网络能够通过自适应调整表示向量模长来弥补SSM损失函数的不足，起到相互促进的效果。在公开数据集上的实验表明，与图推荐算法结合，SSM损失函数在经典和长尾两种推荐任务中均能取得优异的推荐精准度，同时其训练效率也显著优于现有方法。

关键词

个性化推荐/图神经网络/自监督学习/数据处理

引用本文复制引用

授予学位

博士

学科专业

信息与通信工程

导师

何向南

学位年度

2022

学位授予单位

中国科学技术大学

语种

中文

中图分类号

段落导航