首页|基于时空数据挖掘的兴趣点推荐算法研究

基于时空数据挖掘的兴趣点推荐算法研究

刘永恒

基于时空数据挖掘的兴趣点推荐算法研究

刘永恒1
扫码查看

作者信息

  • 1. 北京工业大学
  • 折叠

摘要

兴趣点(Point Of Interest,POI)推荐是基于位置的社交网络(Location-Based Social Networks,LBSN)中的一项基本任务。LBSN的日益普及产生大量用户打卡数据。这些数据可以帮助理解用户行为。兴趣点推荐对于鼓励用户探索城市、促进线下经济的发展均起到重要作用,获得工业界和学术界的极大关注。 根据推荐目标、适用场景的不同,兴趣点推荐问题可以分成两类:通用兴趣点推荐(常简称为兴趣点推荐,下文均使用简称)和下一个兴趣点推荐。兴趣点推荐旨在为用户推荐所有可能感兴趣的兴趣点,适合用户做长期规划的场景。下一个兴趣点推荐旨在为用户推荐紧接当前打卡记录的下一个兴趣点,适合用户短期选择的场景。用户在现实世界中的活动受到距离和时间的影响。因此,空间和时间是影响用户选择兴趣点的两个关键因素。本文通过研究时空上下文信息的有效利用,分别针对兴趣点推荐和下一个兴趣点推荐提出相应的推荐算法。 在兴趣点推荐问题上,大多数现有推荐算法在利用时空信息时将时间信息、空间信息建模为两个独立特征。本文认为在兴趣点推荐问题上,时间和空间是高度相互依赖的。因此,本文提出基于时空异构信息网络和四元交互模型的兴趣点推荐算法。具体来说,主要工作和贡献如下: (1)本文提出基于异构信息网络的时空联合建模方法。该方法使用异构信息网络作为建模工具,将时间信息和空间信息联合建模为异构信息网络中的一个实体。 (2)本文拓展传统的用户-项目二元交互推荐模型,提出显式建模时空信息的四元交互模型,将时空上下文信息纳入到兴趣点推荐中。在真实数据集上的实验结果表明相对最优基线算法,NDCG@5提升近12%,Rec@5提升约11%。 在下一个兴趣点推荐问题上,现有工作大多基于循环神经网络(Recurrent Neural Network,RNN)建模用户的历史打卡序列。受限于用户打卡数据的稀疏性,RNN的隐状态在传递的过程中充满噪音。此外,对于用户当前的时空上下文,RNN中不同时空上下文的神经元对用户下一个兴趣点推荐的重要性是不同的,而现有研究工作大多忽略这一点。因此,本文提出基于序列规则挖掘和时空模式搜索的下一个兴趣点推荐算法。具体来说,主要工作和贡献如下: (3)本文提出一套新的时空序列规则,解决传统序列规则只能表达顺序共现性,而无法直接应用于打卡序列补全的问题。之后,本文设计三个建模人类行为模式的时空搜索函数:时间周期函数、时间衰减函数及距离衰减函数。基于时空搜索函数,本文提出根据用户当前的时空上下文搜索RNN中更重要的神经元隐状态的下一个兴趣点推荐算法。最后,真实数据集上的实验结果表明,本文提出的算法在Rec@5和Rec@10上分别达到0.1738和0.2192,相比最优基线算法提升约8.6%和约7.3%。

关键词

兴趣点推荐/时空数据/异构信息网络/序列规则

引用本文复制引用

授予学位

硕士

学科专业

计算机技术

导师

杨震

学位年度

2022

学位授予单位

北京工业大学

语种

中文

中图分类号

TP
段落导航相关论文