摘要
随着互联网的飞速发展和教育需求的日益增长,大规模开放在线课程于2012年应运而生。随着大规模在线课程平台的迅猛发展,在线课程平台课程越来越多,教学内容也有了很多冗余,存在信息过载问题,与此同时,在线课程平台上信息的多样性和不确定性使得异构信息没有明确的逻辑关系和结构化的组织方式,使得学习者难以在其中找到自己所需的知识点,从而阻碍了在线学习的发展。传统的基于在线课程平台推荐主要采用基于点击率、TOP-N排名和用户交互等方法,这些都是基于用户历史交互数据去进行推荐。但是,这些方法并未充分考虑到融合其他辅助信息的可能性,忽略了异构信息网络的结构和特性,无法有效地利用不同形式、不同来源的信息。为此,本文提出了一种异构信息网络中基于元路径的课程推荐系统,通过利用多种类型的节点和节点之间的关系和融合更丰富的语义信息,从而产生高质量的最终嵌入并改善推荐算法性能,提高了课程推荐系统的准确性和个性化程度。本文主要研究内容如下: (1)异构信息网络中基于元路径的课程推荐方法。本文首先针对在线课程平台中实体和关系的异质性和复杂性进行研究,确定在线课程异构信息网络中的节点关系并构建了在线课程的异构信息网络模式;其次利用元路径的随机游走策略生成节点序列,使用skig-gram模型学习不同元路径中实体的嵌入表示;接着,进一步利用两级注意力的图卷积网络进行向量融合,邻居级注意力聚合目标节点上不同类邻居,元关系级注意力聚合不同元关系的语义贡献度并自适应地学习到不同邻居与关系之间的重要程度。最后,在真实数据集MoocCubeX上进行了一系列实验,与最优基准方法W-MetaPath2Vec相比,在各项指标都达到最优表现,验证了本方法的有效性和合理性。 (2)在线课程推荐系统平台。针对在线课程推荐系统,设计了四大功能模块来进行实现。首先在数据获取与数据预处理模块,利用爬虫程序对MOOC平台数据进行爬取并利用Hive数据仓库进行数据预处理;其次,在数据存储模块利用关系型数据库PostgreSQL和HDFS工具进行数据存取与转化;接着,在课程推荐模块,利用上述数据置于异构信息网络中基于元路径的课程推荐模型中进行模型训练,从而获得参数更优的模型;最后,在课程服务模块实现用户注册登录、课程搜索和查找和课程展示功能,实现用户在课程学习中的交流互动。该系统在满足在线课程平台基本要求的同时,通过系统推荐功能向用户进行个性化的课程推荐,帮助用户选择高质量的课程,避免面对大量课程信息出现信息迷航。