计算机应用与软件2024,Vol.41Issue(9) :288-293,303.DOI:10.3969/j.issn.1000-386x.2024.09.041

一种满足否定约束的增量数据修复算法

AN INCREMENTAL DATA REPAIR ALGORITHM SATISFYING NEGATION CONSTRAINTS

徐婷 朱云鹏 杨卫东 谈子敬
计算机应用与软件2024,Vol.41Issue(9) :288-293,303.DOI:10.3969/j.issn.1000-386x.2024.09.041

一种满足否定约束的增量数据修复算法

AN INCREMENTAL DATA REPAIR ALGORITHM SATISFYING NEGATION CONSTRAINTS

徐婷 1朱云鹏 1杨卫东 1谈子敬1
扫码查看

作者信息

  • 1. 复旦大学计算机科学技术学院 上海 200438
  • 折叠

摘要

为了提高数据质量,数据修复技术得到了广泛的研究.数据修复通常使用约束,常用的有函数依赖、条件函数依赖和否定约束(Denial Constraints,DCs)等,其中,否定约束具有足够的表达能力,可以包含许多其他依赖项,因此在数据修复中得到了很好的应用.另外,数据通常是动态的,因此需要增量修复技术,以响应数据更新.该文提出一种满足否定约束的增量修复算法,结合辅助的索引结构,能有效地识别增量数据引起的DC冲突.大量的实验结果表明了该方法的有效性和高效性.

Abstract

Data repairing techniques are extensively studied for improving data quality.Data repairing usually uses constraints,commonly-used constraints have functional dependencies,conditional functional dependencies and denial constraints(DCs),etc.where DCs are expressive enough to subsume many other dependencies,and are hence well employed in data repairing.In practice,data is typically dynamic,with this comes the need for incremental repairing techniques,in response to data updates.This paper presents the incremental repairing algorithm that satisfy denial constraints,combining auxiliary indexing structures such that DC violations incurred by incremental data can be efficiently identified.Extensive experiments show the effectiveness and efficiency of our algorithm.

关键词

数据质量/否定约束/增量修复

Key words

Data quality/Denial constraint/Incremental repairing

引用本文复制引用

基金项目

国家自然科学基金项目(U2033209)

出版年

2024
计算机应用与软件
上海市计算技术研究所 上海计算机软件技术开发中心

计算机应用与软件

CSTPCD北大核心
影响因子:0.615
ISSN:1000-386X
段落导航相关论文