首页|基于循环知识图谱与文本挖掘的旅游景点推荐

基于循环知识图谱与文本挖掘的旅游景点推荐

张苗

基于循环知识图谱与文本挖掘的旅游景点推荐

张苗1
扫码查看

作者信息

  • 1. 安徽师范大学
  • 折叠

摘要

随着人民生活水平的逐渐提高,旅游业蓬勃发展,大众旅游时代已经到来。而互联网技术的兴起也使得传统的跟团游模式改变,我们更倾向于自己在网上搜索景点路线,制定旅游攻略。但是各种景点信息纷繁复杂,评价褒贬不一,我们需要花费很长的时间进行抉择。为了提高查询的效率,推荐算法应运而生,传统的推荐算法有协同过滤推荐算法,关联规则算法,序列学习算法等。 本文在研究各种传统推荐算法优缺点的基础上,提出了两种改进算法。第一种是基于循环知识图谱的推荐算法(Recurrent Knowledge Graph Recommendation Algorithm,RKGRA),该算法对传统的序列学习推荐算法进行改进。首先,我们引用可融合多源数据的知识图谱构建方法,将用户和景点之间用关系串联起来,形成“实体—关系—实体”三元组。其次,我们用TransH语义表示方法从知识图谱网络中抽取语义路径,将语义路径输入到循环神经网络中进行训练。最后,我们用sigmoid激活函数生成预测评分,选择预测评分最高的K个景点作为用户推荐列表。 第二种是基于文本挖掘的旅游景点推荐算法(Text Mining Recommendation Algorithm,TMRA),该算法对传统的协同过滤算法进行优化。首先,我们融合了用户评论、用户评分、景点热门度和景点主题等多项数据考量用户兴趣度指标。其次,我们使用文本挖掘技术从用户评论文本中提取各景点特征词,根据特征词提取景点隐含主题。最后,我们计算景点之间的相似度,使用基于物品的协同过滤算法为每个用户生成旅游景点推荐列表。 本文爬取了上海和黄山两地的景点、用户、评论数据作为实验数据,使用上述两种算法为每个用户生成推荐列表。与用户真实的旅游路线进行对比,计算推荐算法的评价指标,召回率和MRR值。实验结果表明,两种算法较传统推荐算法性能都有较大提升,其中RKGRA算法对上海市景点推荐效果提升的更多,TMRA算法对黄山市景点推荐效果提升的更多,且两种算法在对黄山市景点推荐的准确率都比上海市景点更高。

关键词

旅游景点/推荐算法/循环知识图谱/文本挖掘/协同过滤

引用本文复制引用

授予学位

硕士

学科专业

应用统计

导师

方龙祥

学位年度

2020

学位授予单位

安徽师范大学

语种

中文

中图分类号

TP
段落导航相关论文