国家学术搜索
登录
注册
中文
EN
首页
|
基于主数据关键特征值的企业重复主数据识别研究
基于主数据关键特征值的企业重复主数据识别研究
引用
认领
扫码查看
点击上方二维码区域,可以放大扫码查看
原文链接
万方数据
维普
中文摘要:
数字经济时代,越来越多的企业开展数字化转型,对企业数据管理也日渐重视.企业主数据是企业数据管理的重要内容之一,企业主数据是否唯一,严重影响企业基于大数据决策的质量.本文主要研究了目前常用的识别重复企业主数据方法的不足,提出了一种基于主数据关键特征值的企业重复主数据识别方法,该方法主要由主数据初步无损去冗余压缩,主数据分词及词汇调整信息量计算,主数据词汇编码,主数据关键特征值计算,疑似重复主数据识别五步组成.相比传统识别方法有更高的识别准确率.该方法已在企业使用,取得了较好的应用效果.
收起全部
展开查看外文信息
作者:
王强、战培志
展开 >
作者单位:
中兴通讯股份有限公司
江苏省通信服务有限公司
关键词:
大数据
企业主数据
特征值
数据治理
出版年:
2024
江苏通信
江苏省通信学会
江苏通信
影响因子:
0.062
ISSN:
1007-9513
年,卷(期):
2024.
40
(4)