首页|基于集成学习的相似数据表推荐

基于集成学习的相似数据表推荐

扫码查看
在数据对标等实际业务中,需要从大量数据表中找出相似的数据表,这时需要有经验的人工进行筛选,费时费力.基于能够自动化识别并推荐相似数据表的目的,采用了多种文本相似度算法自动识别并推荐相似表及表中相似字段的思路,从数据表名和数据项两方面综合考虑,对于中英文字段分别处理,并引入核心字段来推荐相似表中的相似字段项.通过与专家预设结果的比较,推荐准确率达到81%以上.
Recommended Similar Tables Based on Ensemble Learning

王成泽、汪洋、彭艳兵

展开 >

武汉邮电科学研究院 武汉 430070

南京烽火天地通信科技有限公司 南京 210019

集成学习 文本相似度 数据表

2022

计算机与数字工程
中国船舶重工集团公司第七0九研究所

计算机与数字工程

CSTPCD
影响因子:0.355
ISSN:1672-9722
年,卷(期):2022.50(4)
  • 4