摘要
得益于互联网的快速发展,人们可以便捷地获取大量信息,但也面临着信息过载问题。为了帮助用户在海量的数据中找到感兴趣的项目,个性化推荐系统应运而生。然而,大多数真实数据集中用户与推荐项目的交互相对稀少,导致模型无法获取足够信息以学习用户偏好,从而产生冷启动问题。 为此,已有不少研究工作在推荐中引入辅助信息,比如项目属性特征、用户社交信息等,以缓解冷启动问题。这些工作取得了不错的效果,但是仍存在以下不足:1)所采用的建模方式不完善,没有充分挖掘出不同元路径形式内部信息;2)信息融合方式单调简略,无法针对目标节点有效聚合元路径内部丰富的上下文信息。这两个问题都会导致用户和项目表征不完善。 针对上述问题,本文提出基于注意力机制的异质图网络推荐框架。基于图神经网络汇聚不同层次的信息,针对目标节点进行聚合操作,得到的用户项目嵌入表示与元路径上下文内容关系更密切,表征内容更丰富。最后在特征不同的两个真实数据集上进行实验验证和性能评估。本文贡献如下: (1)针对元路径信息利用不充分问题,加入连边信息,设计了基于关系旋转的用户项目所在元路径实例信息聚合方式。在保留元路径内部节点向量信息的同时,增加了对节点位置信息的利用。实验表明:相比基线模型MCRec,准确率、召回率和归一化折损累计增益分别提升了8.02%、5.05%和3.22%。 (2)针对异质信息挖掘过程粗粒度问题,提出了基于注意力机制的用户项目所在不同元路径实例信息融合策略。采用多头注意力机制汇聚不同来源的元路径实例信息,能够克服异质图所带来的不稳定性。实验表明:相比基线模型MCRec,准确率、召回率和归一化折损累计增益分别提升了5.63%、2.72%和2.96%。 (3)融合上述两点,在两个特征不同真实数据集上进行个性化推荐实验,实验表明:在数据分布较为平均的LastFM数据集上的准确率、召回率和归一化折损累计增益分别达到了0.52、0.53和0.88,相比基线模型MCRec分别提升了9.50%、6.09%和3.64%,在多数用户项目分布较为稀疏的Movielens数据集上三个指标分别达到了0.41、0.26和0.79,相比基线模型MCRec分别提升了20.30%、21.17%和14.25%。冷启动对比实验也表明:随着数据稀疏性的增强,算法的提升效果也越明显,其中在最稀疏的数据集上三个指标分别提升了24.94%、26.54%和19.82%。 本文工作有助于电商平台对用户精准推荐商品,具有一定实际意义。