计算机研究与发展2021,Vol.58Issue(11) :2500-2514.DOI:10.7544/issn1000-1239.2021.20200554

基于滑动窗口模型的数据流闭合高效用项集挖掘

Closed High Utility Itemsets Mining over Data Stream Based on Sliding Window Model

程浩东 韩萌 张妮 李小娟 王乐
计算机研究与发展2021,Vol.58Issue(11) :2500-2514.DOI:10.7544/issn1000-1239.2021.20200554

基于滑动窗口模型的数据流闭合高效用项集挖掘

Closed High Utility Itemsets Mining over Data Stream Based on Sliding Window Model

程浩东 1韩萌 1张妮 1李小娟 1王乐1
扫码查看

作者信息

  • 1. 北方民族大学计算机科学与工程学院 银川 750021
  • 折叠

摘要

从数据流中挖掘高效用项集是一项具有挑战性的任务,因为传入的数据必须在时间和存储内存约束下进行实时处理数据流挖掘通常会产生大量冗余的项集,为了减少这些无用的项集数量且保证无损压缩,需要挖掘闭合项集,它可以比全集高效用项集的集合小几个数量级.为了解决以上问题,提出一种基于滑动窗口模型的数据流闭合高效用项集挖掘(closed high utility itemsets mining over data stream based on sliding window model,CHUI_DS)算法.在 CHUI DS 中设计了 一种新的效用列表结构,该结构在提升批次插入和删除的速度方面非常有效此外,应用修剪策略来改进闭合项集挖掘过程,消除潜在的低效用候选对象.对真实数据集和合成数据集进行的广泛实验评估显示了该算法的效率以及可行性就速度而言,它优于先前提出的主要以批处理模式运行的算法.且它适用于不同大小的滑动窗口,在事务数量等方面具有较强的扩展性.

关键词

模式挖掘/数据流挖掘/闭合高效用项集/滑动窗口/效用列表

引用本文复制引用

基金项目

国家自然科学基金(62062004)

宁夏自然科学基金(2020AAC03216)

北方民族大学研究生创新项目(YCX20077)

出版年

2021
计算机研究与发展
中国科学院计算技术研究所 中国计算机学会

计算机研究与发展

CSTPCDCSCD北大核心
影响因子:2.649
ISSN:1000-1239
被引量8
参考文献量2
段落导航相关论文