计算机技术与发展2022,Vol.32Issue(1) :47-53.DOI:10.3969/j.issn.1673-629X.2022.01.009

基于二进制编码的Apriori增量更新算法研究

Research on Apriori Incremental Update Improved Algorithm Based on Binary Code

罗章铭 唐杰 黄逸奇 张锦
计算机技术与发展2022,Vol.32Issue(1) :47-53.DOI:10.3969/j.issn.1673-629X.2022.01.009

基于二进制编码的Apriori增量更新算法研究

Research on Apriori Incremental Update Improved Algorithm Based on Binary Code

罗章铭 1唐杰 1黄逸奇 1张锦1
扫码查看

作者信息

  • 1. 湖南师范大学 信息科学与工程学院,湖南 长沙 410006
  • 折叠

摘要

针对经典Apriori算法在迭代过程中频繁扫描数据库,且动态数据更新后需要重新处理数据的不足,提出一种基于二进制编码的增量更新改进CBEF-Apriori算法.该算法的核心思想是将添加增量后的项集、事务转换成二进制编码,从而将计算项集支持度转化为项集与事务数据库的二进制编码位运算过程.改进算法筛选原数据库生成的频繁项集与增量数据库新生成的候选项集,有效减少了候选项集的规模,提高算法效率的同时更符合现实需要.实验结果表明,相比于经典Apriori算法和CBE-Apriori算法,改进算法在挖掘出正确频繁项集的数量不降低的情况下,明显提升了计算效率,在小数据规模下相比经典Apriori算法最高提升3.6倍,相比CBE-Apriori算法最高提升1.4倍.在较大数据规模下相比经典Apriori算法最高提升10.41倍,相比CBE-Apriori算法最高提升11.53倍.

关键词

数据挖掘/Apriori算法/关联规则/二进制/增量更新

引用本文复制引用

基金项目

军委装发预研项目(31511010105)

国防科工局国防基础科研计划(WDZC20205500119)

湖南省交通厅科技进步与创新计划(201927)

湖南省研究生培养创新实践基地项目(湘教通[2019]248号)

湖南省科技厅创新引领计划(2020GK2009)

出版年

2022
计算机技术与发展
陕西省计算机学会

计算机技术与发展

CSTPCD
影响因子:0.621
ISSN:1673-629X
被引量1
参考文献量8
段落导航相关论文