计算机工程与设计2024,Vol.45Issue(5) :1398-1405.DOI:10.16208/j.issn1000-7024.2024.05.016

高平均模糊效用项集挖掘算法

High average fuzzy utility itemset mining algorithm

王斌 李晓华 周伟 胡克勇
计算机工程与设计2024,Vol.45Issue(5) :1398-1405.DOI:10.16208/j.issn1000-7024.2024.05.016

高平均模糊效用项集挖掘算法

High average fuzzy utility itemset mining algorithm

王斌 1李晓华 1周伟 1胡克勇1
扫码查看

作者信息

  • 1. 青岛理工大学信息与控制工程学院,山东青岛 266520
  • 折叠

摘要

为解决高模糊效用项集挖掘算法中存在的挖掘结果中含有大量无效的长项集以及搜索空间过大的问题,提出一种高平均模糊效用项集挖掘算法HAFUIM(high average fuzzy utility itemset mining algorithm).定义平均模糊效用,考虑项集的模糊效用和长度的关系,解决倾向于挖掘长项集的问题;提出平均模糊上限模型和4种剪枝性质,缩小搜索空间;设计平均模糊列表结构用于存储必要的效用信息,减少数据库扫描次数.通过仿真实验验证了所提算法的可行性和高效性.

Abstract

To solve the problems of a large number of invalid long itemset in mining results and excessive search space in the high fuzzy utility itemset mining algorithm,the HAFUIM(high average fuzzy utility itemset mining algorithm)was proposed.The average fuzzy utility was defined,the relationship between the fuzzy utility and the length of the itemset was considered,and the problem of tending to mine the long itemset was solved.An average fuzzy upper bound model and four pruning properties were proposed,which effectively narrowed the search space.The average fuzzy list structure was designed to store the necessary utility information and reduce the number of database scans.The results of simulation experiments show that the proposed algo-rithm is feasible and efficient.

关键词

数据挖掘/项集挖掘/高模糊效用/平均模糊效用/平均模糊上限模型/平均模糊列表/剪枝策略

Key words

data mining/itemset mining/high fuzzy utility/average fuzzy utility/average fuzzy upper bound model/average utility list/pruning strategy

引用本文复制引用

基金项目

国家自然科学基金(61902205)

出版年

2024
计算机工程与设计
中国航天科工集团二院706所

计算机工程与设计

CSTPCD北大核心
影响因子:0.617
ISSN:1000-7024
参考文献量17
段落导航相关论文