首页|一种基于关联数据的科技项目查重系统

一种基于关联数据的科技项目查重系统

扫码查看
论文提出了一种基于关联数据的科技项目查重系统,通过整合与科技项目密切相关的项目任务书、科技论文、科技报告和科技成果等信息,建立科技项目的描述模型.采用改进的TextRank算法从摘要和标题等短文本中抽取关键词构建特征向量,并提出了项目相似度的判别方法.利用Hadoop和Spark的分布式计算框架,实现了项目查重系统并进行了相关的实验.结果证明了该方法的有效性和可行性,在给定的实验条件下取得了较高的准确率和召回率.
A Linked-data Based Similarity Detection System for Scientific Projects

李善青、安淑荻、邢晓昭

展开 >

中国科学技术信息研究所 北京 100038

关联数据 科技项目查重 数据挖掘 多源信息整合 Hadoop架构

国家自然科学基金中国科学技术信息研究所创新研究基金

71303223QN2020-01

2022

计算机与数字工程
中国船舶重工集团公司第七0九研究所

计算机与数字工程

CSTPCD
影响因子:0.355
ISSN:1672-9722
年,卷(期):2022.50(5)
  • 9