摘要
近年来,随着计算机和网络技术的蓬勃发展,互联网信息超载现象日趋严重,海量的信息、数据让用户无法有效捕捉获取自己需要的信息。目前,推荐系统作为解决信息超载,帮助用户获取信息的有效工具,已经在诸多领域获得了快速发展并取得了卓越成就。同时,随着web2.0时代的到来,基于标签的推荐算法渐渐被研究者广泛关注。但是,传统的标签推荐算法存在着数据稀疏、冷启动等导致推荐不准确的问题。 为了解决推荐系统冷启动,提高推荐准确度,本文基于word2Vec技术,训练获得词向量来计算物品的文本相似度,以此来表征物品在内容上的相似性,通过此相似度改进现有的推荐算法,提出一种综合考虑用户行为和物品内容两个方面的混合推荐算法。本文首先从推荐系统的相关理论入手,介绍组成推荐系统的各个模块、推荐系统评测方法以及推荐系统应用,接着阐述了标签的概念、标签在推荐系统中的意义,以及目前常用的标签推荐算法。然后介绍了word2Vec技术的相关原理,word2Vec作为一种训练词向量来表征文本语义的有效工具,可以帮助我们理解、处理许多自然语言处理相关的问题。本文借助word2Vec工具训练词向量并提出文本相似度概念,用该相似度表征物品内容上的相关性,进而基于此相似度改进现有的推荐算法,该算法一方面改善推荐系统物品启动问题,另一方面过滤打压内容相似度低的物品,提高推荐准确度。最后,通过仿真实验,从多个评测指标验证了改进算法的有效性。