首页|短文本聚合在元器件供方匹配中的应用与研究

短文本聚合在元器件供方匹配中的应用与研究

扫码查看
航天采购部门采购合格供方的元器件是保证航天用元器件可靠性的方法之一.确定供方是否在合格供方目录中,是航天元器件采购流程中的一个重要步骤.但由于航天各院所系统中对供方定义标准不一致,常以供方公司的别称、简称代替供方名称,这导致同一供方出现多种不同名称,这给如何匹配合格供方带来了挑战.针对航天各院所系统中的供方数据的特征,提出了一种结合Jaro-Winkle算法和Levenshtein算法的融合算法.该算法通过引入调整阈值及系数,将字符的位序、字符替换、添加、删除操作等因素纳入到供方名称的短文本相似度计算中,提高供方名称的短文本匹配准确率.通过在航天元器件合格供方匹配流程中的应用,该算法有效提高了供方的匹配准确率.
Application and Research of Short Text Aggregation in Component Supplier Matching

魏自强、班元郎、徐伟、王文玺

展开 >

贵州航天计量测试技术研究所,贵州 贵阳 550009

Jaro-Winkler算法 Levenshtein距离 短文本聚合模型 数据特征 供方匹配

国防科工局基础科研项目

JSZL20191201ZL0002

2022

计算机技术与发展
陕西省计算机学会

计算机技术与发展

CSTPCD
影响因子:0.621
ISSN:1673-629X
年,卷(期):2022.32(7)
  • 5