摘要
近年来,互联网不断发展,信息过载成为每个用户无时无刻都在面对的问题。推荐系统作为一种有效的信息过载解决方案,不仅帮助用户发现了有价值的信息,也帮助平台方获得更多的流量和营收。因此,推荐系统已经广泛应用于电子商务、社交媒体等各种平台上,成为以用户为中心的智能应用中最受欢迎的现代信息系统之一。成功的推荐系统的关键在于准确地建模用户偏好,为了实现这个目标,研究人员提出了许多算法,而序列化推荐是非常有效的一种。序列化推荐旨在捕捉用户不断变化的偏好。直观地说,用户通常是因为某些特定的特征与物品互动,而用户不断变化的偏好本质上是由时间线上一系列重要特征决定的。然而,现有的序列化推荐模型通常通过单一的嵌入向量表示每个物品,这种方式无法挖掘物品细粒度特征,更不必说对特征序列进行建模了。为了弥补这一空缺,本文提出了一种新的序列化推荐模型,通过学习潜在的关键物品特征序列来促进更有针对性的模型优化和更好的推荐性能。为了实现这个目标,我们首先通过显式或潜在特征来表示每个物品,然后建立软模型和硬模型来寻找最优特征序列。具体而言,在软模型中,我们设计了一个二维注意力机制,同时区分序列中不同物品的重要性和同一物品的不同特征的之重要性。对于硬模型,我们将特征路由问题视作马尔可夫决策过程,并提出了基于强化学习的方式来动态生成关键特征序列。在实验中,我们在真实世界数据集上比较了我们的模型与最新技术的方法,在NDCG和MRR上分别实现了 8.2%和16.1%的改进。