计算机工程与设计2024,Vol.45Issue(3) :845-851.DOI:10.16208/j.issn1000-7024.2024.03.028

基于滑动窗口含负项的高效用模式挖掘

High utility pattern mining with negative unit profits based on sliding window

武妍 荀亚玲 马煜
计算机工程与设计2024,Vol.45Issue(3) :845-851.DOI:10.16208/j.issn1000-7024.2024.03.028

基于滑动窗口含负项的高效用模式挖掘

High utility pattern mining with negative unit profits based on sliding window

武妍 1荀亚玲 2马煜2
扫码查看

作者信息

  • 1. 太原科技大学 经济与管理学院,山西 太原 030024
  • 2. 太原科技大学计算机科学与技术学院,山西太原 030024
  • 折叠

摘要

针对传统高效用模式挖掘均未考虑项的效用值为负,以及对流数据处理的时效性问题,提出一种基于滑动窗口的高效用挖掘算法HUPN_SW.利用一种新定义的滑动窗口正负效用列表PNSWU-List,维护挖掘最近批次高效用模式集所需的所有信息,实现有效的逐批次挖掘,避免重复的数据库扫描,在不产生候选效用模式集的情况下,直接挖掘出高效用模式,使HUPN_SW有效适应于动态流数据.实验结果表明,HUPN_SW算法在运行时间和可扩展性方面有良好表现.

Abstract

The negative utility values of items are not considered and the efficiency of streaming data processing in high utility pattern mining algorithm is not acceptable.An efficient high utility pattern mining algorithm with negative unit profit based on sliding window(HUPN_SW)was proposed.A novel utility list structure was designed,namely positive and negative with sli-ding window utility list(PNSWU-List).The high utility itemsets could be efficiently mined from the latest data in the sliding window without multiple database scans and candidate generation.HUPN_SW was effective for dynamic streaming data.Experi-mental results show that HUPN_SW algorithm exhibits good performance in terms of running time and scalability.

关键词

频繁模式挖掘/滑动窗口/高效用模式挖掘/高效用项集/负效用/流数据/效用列表

Key words

frequent pattern mining/sliding window/high utility pattern mining/high utility itemsets/negative utility/strea-ming data/utility list

引用本文复制引用

基金项目

国家自然科学基金(62272336)

山西省自然科学基金(201901D211302)

出版年

2024
计算机工程与设计
中国航天科工集团二院706所

计算机工程与设计

CSTPCD北大核心
影响因子:0.617
ISSN:1000-7024
参考文献量22
段落导航相关论文