摘要
互联网的迅速发展和应用普及为用户获取信息提供了便利,但同时由此造成的信息过载也给用户有效使用信息带来了困扰。推荐技术的快速发展和推荐系统的广泛使用为用户高效获取信息提供了有效保障。然而,传统的单域推荐方法通常面临数据稀疏性和冷启动问题。近年来,由于跨域推荐算法可以利用不同领域的知识来解决这些问题,因此受到了越来越多的关注。虽然现有的跨域推荐算法在许多应用场景下都能取得良好的推荐效果,但是大多数跨域推荐算法仅利用了评分信息,因此在为用户进行推荐时仍然会在一定程度上受到评分矩阵稀疏性的限制。为此,考虑到各种辅助信息在单域推荐中对提升推荐性能的有益性,本文研究了在跨域推荐场景下将评分信息与多种类的辅助信息进行有效结合的方法,以进一步提升跨域推荐的性能。本文的主要工作如下: (1)在对推荐系统的数据稀疏性和冷启动问题进行研究的基础上,借助于单域推荐中融合辅助信息的混合推荐思想,提出了融合内容和隐式反馈信息的跨域推荐算法。首先,扩展传统的堆叠降噪自动编码器,在源域中以联合训练的方式来深度融合评分信息、用户和项目的内容信息以及隐式反馈信息。并借助于CBT模型,设计从源域到目标域的评分迁移模式,通过非完备正交非负矩阵三分解方法来扩展输入信息的规模,以克服现有方法对数据的完备性限制。为此,本文在一定程度上解决了目标域冷启动用户的特征缺失问题,提高了推荐的准确性。 (2)为了缓解跨域推荐中多数据源信息融合不充分的问题,本文将矩阵分解模型和特征提取模型Semi-SDAE相结合,提出了一种非完备多源知识迁移的跨域推荐算法。该算法首先在源域和目标域中对两种不同的Semi-SDAE模型进行同步训练,并将Semi-SDAE和矩阵分解相集成,通过在两个域中同时融合多种数据源信息,使提取出的用户和项目潜在特征包含更为丰富的语义信息。同时利用特征转换函数来缓解神经网络特征变换带来的信息损失问题,以克服评分预测和特征提取之间的差异。在此基础上,采用非完备正交非负矩阵三分解方法建立源域和目标域之间的关联。 (3)基于上述提出的算法,本文设计并实现了一个融合辅助信息的跨域推荐应用系统。本系统通过将辅助信息融入到跨域推荐算法中进行处理,并与用户评分信息相集成,从而为用户提供电影列表推荐,并且可以有效过滤用户不喜欢内容的推荐。