首页|基于主数据关键特征值的企业重复主数据识别研究

基于主数据关键特征值的企业重复主数据识别研究

扫码查看
数字经济时代,越来越多的企业开展数字化转型,对企业数据管理也日渐重视.企业主数据是企业数据管理的重要内容之一,企业主数据是否唯一,严重影响企业基于大数据决策的质量.本文主要研究了目前常用的识别重复企业主数据方法的不足,提出了一种基于主数据关键特征值的企业重复主数据识别方法,该方法主要由主数据初步无损去冗余压缩,主数据分词及词汇调整信息量计算,主数据词汇编码,主数据关键特征值计算,疑似重复主数据识别五步组成.相比传统识别方法有更高的识别准确率.该方法已在企业使用,取得了较好的应用效果.

王强、战培志

展开 >

中兴通讯股份有限公司

江苏省通信服务有限公司

大数据 企业主数据 特征值 数据治理

2024

江苏通信
江苏省通信学会

江苏通信

影响因子:0.062
ISSN:1007-9513
年,卷(期):2024.40(4)