首页|科技项目语义查重算法

科技项目语义查重算法

扫码查看
项目查重是科技项目价值评估的重要一环,主要解决项目立项环节不同单位重复申报、同一项目多次申报及项目文档抄袭等问题.近年来,电力企业科技项目填报数量呈逐年增长的趋势,这对项目查重的准确度、效率及使用便利性提出了更高的要求.针对电力企业科技项目立项查重需求,提出了基于预训练指纹模型(Pre-trained Finger Print Model,PFM)的语义查重策略,通过数据预处理、特征工程、模型训练、模型评估、模型部署和模型微调等过程,以句子指纹为单位,对待查项目与历史项目关键要素进行分层语义查重,根据项目分层语义相似度指标进行相关度倒排,从语义上高效精准地发现研究内容相似的项目,以此支撑电力企业科技项目立项审查工作.

林正平、杨宇亮、李士杰

展开 >

南方电网科学研究院有限责任公司,广东 广州 510663

科技项目 预训练指纹模型 语义查重 立项审查

2024

科技与创新
中国计算机用户协会

科技与创新

ISSN:1008-0570
年,卷(期):2024.(21)