首页|基于多模态学习与自监督学习的图推荐算法研究

基于多模态学习与自监督学习的图推荐算法研究

张瀚允

基于多模态学习与自监督学习的图推荐算法研究

张瀚允1
扫码查看

作者信息

  • 1. 燕山大学
  • 折叠

摘要

随着互联网时代的来临,信息数量爆炸式增长和信息复杂程度与日俱增,信息超载成为了亟待解决的问题,于是推荐系统在上世纪九十年代就成为一个专门的学科进行研究。然而传统的基于图神经网络推荐算法在冷启动处理、高阶信息聚合、无标签学习等方向上存在不足,因此本文围绕多模态数据推荐问题展开研究,采用多模态学习、自监督学习以及图数据结构增强等方法,并提出了三个算法模型。 首先,针对推荐系统冷启动以及传统图神经网络难以自适应捕捉用户偏好等问题,本文面向视频、音频和文本数据,提出了基于多模态学习的图门控注意力网络推荐算法。该方法将多模态表征嵌入到模型之中对用户偏好进行建模,然后将注意机制引入到图神经网络框架中,用于分离用户对不同模态的偏好,并进一步引入了门控机制,对多模态交互图中的信息流进行控制和加权,便于理解用户行为。 其次,针对推荐系统高度依赖标签导致的人工标注高成本、图卷积神经网络高阶信息损失、模型泛化能力弱等问题,本文提出了基于自监督学习的胶囊图卷积网络推荐算法,该方法使用胶囊图卷积网络来捕获节点间的高阶关系并构建监督信号,并采用三种数据增强模式来构造对比视图和自监督信号,进一步采用噪声对比估计来构建对比损失,实现自监督学习的引入。 再次,本文对多模态与自监督学习基于的图学习推荐进行了一次尝试,旨在解决传统推荐范式受监督数据稀疏和未触及模式和结构的影响的这些局限性,进一步探索推荐系统的潜力。面向视频、音频和文本数据,本文提出了基于多模态学习和自监督学习的图神经网络推荐算法,该方法设计了一个多模态并行的基于图的推荐模型作为主监督学习任务,并根据多通道模式设计了三种不同粒度的数据增强方法来构建多模态自监督组件。 最后,本文在Tiktok、Kwai、MovieLens、Last-FM、Yelp等数据集上进行了广泛的实验,并与先进的基线模型进行了对比,对关键组件和重要参数进行了探索研究,分析和验证了所提出模型的有效性和优越性。

关键词

图推荐算法/多模态学习/自监督学习/图神经网络

引用本文复制引用

授予学位

硕士

学科专业

计算机科学与技术

导师

唐杰

学位年度

2023

学位授予单位

燕山大学

语种

中文

中图分类号

TP
段落导航相关论文