国家学术搜索
登录
注册
中文
EN
首页
|
序列模式挖掘研究
序列模式挖掘研究
引用
扫码查看
点击上方二维码区域,可以放大扫码查看
原文链接
NETL
中文摘要:
序列模式挖掘是数据挖掘的一个重要分支,在金融通讯等领域应用中,序列模式挖掘发挥了重要的作用。虽然到目前为止,关于序列模式的挖掘算法已经相对成熟,但绝大部分算法都是面向静态序列数据的,而现实中的数据总是不断更新的,如何在序列模式增量式挖掘中提高时空效率成为当下序列模式挖掘中一个重要的研究课题,文章在分析了序列模式挖掘特点提出了针对序列模式增量式挖掘的方法。同时,随着数据挖掘中隐私保护问题日益突出,序列模式挖掘中的隐私保护也显得异常重要,为此,文章也提出了一种解决序列模式挖掘中隐私保护的方法。 针对序列模式增量式更新挖掘算法产生大量候选项集以及多次扫描数据库的问题,提出了一种有效的增量式更新算法SPIU_2SM,该算法利用基于2-序列矩阵挖掘算法ESPE对原数据库和增加数据库一次扫描产生序列模式,利用2-序列及2-序列矩阵对序列数据进行重新编码,降低了更新算法的空间复杂度,在此基础上通过对频繁模式和非频繁模式进行相应的剪枝减少了序列的比较和扫描次数,降低了更新算法时间复杂度,实验结果表明该算法是有效的和准确的。 针对序列模式挖掘中隐私保护采用随机隐藏算法需要对原始数据作大幅改动带来的弊端,提出了基于序列模式挖掘的隐私保护算法PPSM,一方面该算法通过对需要隐藏的敏感序列模式集的预处理,降低了算法时间复杂度,另一方面通过搜寻共同支持交易列作为优先修改删除项,减少对原始序列数据的修改,从而提高算法的执行效率,降低对原始数据的修改比率。实验效能分析和实验结果表明,该算法是有效的和正确的。
收起全部
展开查看外文信息
作者:
吴永俊
展开 >
关键词:
数据挖掘
序列模式
增量式更新
隐私保护
修改比率
授予学位:
硕士
学科专业:
计算机软件与理论
导师:
郑诚
学位年度:
2010
学位授予单位:
安徽大学
语种:
中文
中图分类号:
TP