计算机科学2021,Vol.48Issue(3) :174-179.DOI:10.11896/jsjkx.191200154

基于关系图谱的科技数据分析算法

Technology Data Analysis Algorithm Based on Relational Graph

张寒烁 杨冬菊
计算机科学2021,Vol.48Issue(3) :174-179.DOI:10.11896/jsjkx.191200154

基于关系图谱的科技数据分析算法

Technology Data Analysis Algorithm Based on Relational Graph

张寒烁 1杨冬菊2
扫码查看

作者信息

  • 1. 北方工业大学大规模流数据集成与分析技术北京市重点实验室 北京 100144
  • 2. 北方工业大学云计算研究中心 北京 100144
  • 折叠

摘要

随着科技数据量的不断增长,各科技部门积累了大量科技项目的科技管理数据.对于大量结构化数据,需要针对分散数据进行整理、分析,最终按需求提供数据查询与抽取服务.由于在关系数据库中关联关系的分析效果不佳,为了提高分析效率,文中引入了关系图谱进行数据处理.首先,提出了一种基于词频的实体搜索与定位算法来提取实体和关系,并构建关系图谱;其次,对关系图谱进行分析,提出了一种基于改进FP-growth的图数据频繁项挖掘算法;然后,设计了基于图数据的数据筛选流程,进行数据的筛选、分析,并定义评分矩阵,对待筛选数据情况进行评价,最终给出分析意见,且数据筛选的评价标准可以进行自定义;最后,结合构建的关系图谱,将算法进行了实际应用,并将其封装为服务.实验结果表明,提出的基于改进FP-growth的频繁项挖掘算法相比传统FP-growth算法在时间上有10%~12%的提升,数据筛选过程的准确率达到97%左右.

关键词

关系图谱/数据分析/图谱构建/人员关系图谱/数据挖掘/服务应用

引用本文复制引用

基金项目

国家重点研发计划课题(2019YFB1405103)

出版年

2021
计算机科学
重庆西南信息有限公司(原科技部西南信息中心)

计算机科学

CSTPCDCSCD北大核心
影响因子:0.944
ISSN:1002-137X
被引量2
参考文献量11
段落导航相关论文