首页|基于知识图谱的开源软件关联分析与推荐

基于知识图谱的开源软件关联分析与推荐

赖星锦

基于知识图谱的开源软件关联分析与推荐

赖星锦1
扫码查看

作者信息

  • 1. 广东工业大学
  • 折叠

摘要

作为软件创新的重要驱动力,开源项目已成为学术界和工业界关注的焦点,逐渐改变全球信息产业发展的格局,然而碎片化、无序的资源特点也带来使用者难以在海量信息中获取目标项目、部分项目曝光率不足等一系列问题。构建面向用户的开源项目推荐系统可以通过合理的推荐策略来推送与用户目标相近的资源,可以缩短用户浏览和筛选资源的时间。近年兴起的知识图谱具有直观展示知识实体的关联对象范围的优点,可以精准把控知识交叉渗透的趋势,体现知识发展过程中的动态变化以及知识群体内在的一些发展规律,描述项目之间的隐藏特征,因此基于知识图谱开发推荐系统既可以体现知识的动态变化以及内在的发展规律,也可以提升推荐结果的准确性、多样性与可解释性。 为帮助使用者从海量项目信息中寻找目标资源,本课题通过构造开源项目知识图谱,提取项目之间的特征关系,解决开源项目的分散化和杂乱性问题,实现海量数据检索,并结合相关推荐策略提高推荐性能。本文以基于开源项目知识图谱的推荐系统为研究主题,对知识图谱构建技术、推荐理论展开一系列研究,并对基于开源项目知识图谱的推荐技术提出一整套实现方案,研究内容主要包含以下三个方面:(1)针对开源项目关键词海量数据、冗余信息的问题,本课题提出基于超像素锚图二重降维的聚类算法(SDASC)(该工作已发表在核心期刊《计算机应用》)。该算法通过超像素分割区域,对各区域进行分治PCA降维,解决词语多领域有效划分,减少了冗余信息,从而提高同领域词汇聚类精度;在此基础上,提出基于锚点的自适应聚类方法,有效提高聚类速度的同时,减少额外的高斯参数调节。(2)研究知识图谱合理构建方法,提出基于特征集合构建方法,分析该方法的缺点并提出多特征存储的形式,在Bert模型的基础上结合BGRU与CRF进行特征之间的关系预测,实现上下文场景信息融合处理辅助预测,提高从大量长段文本中识别特征关系的精准度,完成基于特征关系的知识图谱的构建。并应用TransG模型进行知识推理应用,保证知识图谱的可扩展性与稳定性,解决知识图谱增量扩展问题。(3)针对多场景下多用户推荐需求,研究应用于推荐系统的推荐策略,以开源项目知识图谱推荐为主,引入Wide-Deep模型对用户行为进行预测,结合用户聚类、项目热度、用户标签进行推荐以扩展推荐内容。使用相关技术完成推荐系统开发,并通过性能测试确保系统的稳定性与可用性,解决系统推荐功能、推荐性能平衡性问题与推荐渠道多样性问题。 本文旨在通过上述内容的研究解决开源项目知识图谱在构建过程中的难点,通过深度学习等方法提升项目特征、用户行为规律的处理能力,最终构建一个能够满足用户实际需求的开源项目推荐系统。

关键词

开源项目/知识图谱/推荐系统/深度学习

引用本文复制引用

授予学位

硕士

学科专业

新一代电子信息技术

导师

杨晓君

学位年度

2023

学位授予单位

广东工业大学

语种

中文

中图分类号

TP
段落导航相关论文