首页|基于GEP的多层关联规则挖掘算法及其应用

基于GEP的多层关联规则挖掘算法及其应用

扫码查看
为了在Web使用挖掘中挖掘网站服务器日志数据库的热点Web页面访问集及发现其关联规则,提出了一种新的基于GEP(gene expression programming,基因表达式编程)的适用于挖掘多层关联规则的算法.将泛化技术应用于GEP作为它的适应性函数度量,引入GEP强大的自搜索功能,进化到较优的种群后,再利用传统的支持度一置信度的方法在子数据库的多个层及层间挖掘频繁项及关联规则.该算法改进了传统多层关联规则挖掘框架,实验结果表明了该算法在大数据库中的有效性和高效性.
Multiple-layers association rule mining algorithm based on GEP and it's application
To mine popular accessed web pages items and find out their association rule from the web server log database in WUM (web usage mining).A novel GEP-based algorithm for mining multiple-layers association rules is presented.Firstly,generalizing technology is taken as a way to value fitness function in GEP (gene expression programming).Then,relying on the significant self-search function of GEP,the most optional species is evolved.The frequent items and association rules in the next deeper layers can be mined by using traditional support-confidence method in sub-database.The algorithm improves on the frame of traditional association rule mining.Finally,the validity and efficiency of the presented method is demonstrated by the application in big database.

GEPmultiple-layers association ruleweb usage mininggeneralizingdata miningabstract frequency items

蔡宏果、元昌安、彭昱忠、陶俊剑

展开 >

广西师范学院,计算机与信息工程学院,广西,南宁,530023

基因表达式编程 多层关联规则 Web使用挖掘 泛化 数据挖掘 抽象频繁项集

国家自然科学基金广西高等学校优秀人才计划基金广西研究生教育创新计划

60763012RC20070222009106030774M03

2010

计算机工程与设计
中国航天科工集团二院706所

计算机工程与设计

CSTPCDCSCD北大核心
影响因子:0.617
ISSN:1000-7024
年,卷(期):2010.31(1)
  • 9
  • 6