科技与创新2024,Issue(21) :145-147.DOI:10.15913/j.cnki.kjycx.2024.21.044

科技项目语义查重算法

林正平 杨宇亮 李士杰
科技与创新2024,Issue(21) :145-147.DOI:10.15913/j.cnki.kjycx.2024.21.044

科技项目语义查重算法

林正平 1杨宇亮 1李士杰1
扫码查看

作者信息

  • 1. 南方电网科学研究院有限责任公司,广东 广州 510663
  • 折叠

摘要

项目查重是科技项目价值评估的重要一环,主要解决项目立项环节不同单位重复申报、同一项目多次申报及项目文档抄袭等问题.近年来,电力企业科技项目填报数量呈逐年增长的趋势,这对项目查重的准确度、效率及使用便利性提出了更高的要求.针对电力企业科技项目立项查重需求,提出了基于预训练指纹模型(Pre-trained Finger Print Model,PFM)的语义查重策略,通过数据预处理、特征工程、模型训练、模型评估、模型部署和模型微调等过程,以句子指纹为单位,对待查项目与历史项目关键要素进行分层语义查重,根据项目分层语义相似度指标进行相关度倒排,从语义上高效精准地发现研究内容相似的项目,以此支撑电力企业科技项目立项审查工作.

关键词

科技项目/预训练指纹模型/语义查重/立项审查

引用本文复制引用

出版年

2024
科技与创新
中国计算机用户协会

科技与创新

ISSN:1008-0570
段落导航相关论文