计算机应用研究2021,Vol.38Issue(10) :3049-3054.DOI:10.19734/j.issn.1001-3695.2021.02.0055

基于洗牌算法的大数据抽样有效性分析

Analysis of sampling effectiveness of big data based on shuffling algorithm

刘涵阅 张春生
计算机应用研究2021,Vol.38Issue(10) :3049-3054.DOI:10.19734/j.issn.1001-3695.2021.02.0055

基于洗牌算法的大数据抽样有效性分析

Analysis of sampling effectiveness of big data based on shuffling algorithm

刘涵阅 1张春生1
扫码查看

作者信息

  • 1. 内蒙古民族大学 计算机科学与技术学院,内蒙古 通辽028043
  • 折叠

摘要

基于折叠技术的洗牌算法具有较好的数据置乱效果,可以满足大数据抽样的前提条件.为证明置乱后的数据集在经过抽样后内部规则不被破坏,通过数据挖掘的方法对抽样前后的数据进行关联规则分析.对比所得关联规则的支持度、置信度,以及事务出现的频率,发现经过折叠洗牌算法置乱后的数据在抽样前后所得到的关联规则变化相对稳定,并通过与现有算法的时间效率以及抽样总体误差作对比,进一步在理论上得出大数据抽样具有有效性,即可以通过抽样样本来推测数据整体情况.

关键词

大数据/抽样技术/折叠洗牌算法/关联规则/抽样有效性

引用本文复制引用

基金项目

出版年

2021
计算机应用研究
四川省电子计算机应用研究中心

计算机应用研究

CSTPCDCSCD北大核心
影响因子:0.93
ISSN:1001-3695
参考文献量8
段落导航相关论文