计算机技术与发展2022,Vol.32Issue(7) :216-220.DOI:10.3969/j.issn.1673-629X.2022.07.037

短文本聚合在元器件供方匹配中的应用与研究

Application and Research of Short Text Aggregation in Component Supplier Matching

魏自强 班元郎 徐伟 王文玺
计算机技术与发展2022,Vol.32Issue(7) :216-220.DOI:10.3969/j.issn.1673-629X.2022.07.037

短文本聚合在元器件供方匹配中的应用与研究

Application and Research of Short Text Aggregation in Component Supplier Matching

魏自强 1班元郎 1徐伟 1王文玺1
扫码查看

作者信息

  • 1. 贵州航天计量测试技术研究所,贵州 贵阳 550009
  • 折叠

摘要

航天采购部门采购合格供方的元器件是保证航天用元器件可靠性的方法之一.确定供方是否在合格供方目录中,是航天元器件采购流程中的一个重要步骤.但由于航天各院所系统中对供方定义标准不一致,常以供方公司的别称、简称代替供方名称,这导致同一供方出现多种不同名称,这给如何匹配合格供方带来了挑战.针对航天各院所系统中的供方数据的特征,提出了一种结合Jaro-Winkle算法和Levenshtein算法的融合算法.该算法通过引入调整阈值及系数,将字符的位序、字符替换、添加、删除操作等因素纳入到供方名称的短文本相似度计算中,提高供方名称的短文本匹配准确率.通过在航天元器件合格供方匹配流程中的应用,该算法有效提高了供方的匹配准确率.

关键词

Jaro-Winkler算法/Levenshtein距离/短文本聚合模型/数据特征/供方匹配

引用本文复制引用

基金项目

国防科工局基础科研项目(JSZL20191201ZL0002)

出版年

2022
计算机技术与发展
陕西省计算机学会

计算机技术与发展

CSTPCD
影响因子:0.621
ISSN:1673-629X
参考文献量5
段落导航相关论文