国家学术搜索
登录
注册
中文
EN
计算机应用研究
2021,
Vol.
38
Issue
(10) :
3049-3054.
DOI:
10.19734/j.issn.1001-3695.2021.02.0055
基于洗牌算法的大数据抽样有效性分析
Analysis of sampling effectiveness of big data based on shuffling algorithm
刘涵阅
张春生
计算机应用研究
2021,
Vol.
38
Issue
(10) :
3049-3054.
DOI:
10.19734/j.issn.1001-3695.2021.02.0055
下载
引用
认领
✕
来源:
国家科技期刊平台
NETL
NSTL
维普
万方数据
基于洗牌算法的大数据抽样有效性分析
Analysis of sampling effectiveness of big data based on shuffling algorithm
刘涵阅
1
张春生
1
扫码查看
点击上方二维码区域,可以放大扫码查看
作者信息
1.
内蒙古民族大学 计算机科学与技术学院,内蒙古 通辽028043
折叠
摘要
基于折叠技术的洗牌算法具有较好的数据置乱效果,可以满足大数据抽样的前提条件.为证明置乱后的数据集在经过抽样后内部规则不被破坏,通过数据挖掘的方法对抽样前后的数据进行关联规则分析.对比所得关联规则的支持度、置信度,以及事务出现的频率,发现经过折叠洗牌算法置乱后的数据在抽样前后所得到的关联规则变化相对稳定,并通过与现有算法的时间效率以及抽样总体误差作对比,进一步在理论上得出大数据抽样具有有效性,即可以通过抽样样本来推测数据整体情况.
关键词
大数据
/
抽样技术
/
折叠洗牌算法
/
关联规则
/
抽样有效性
引用本文
复制引用
基金项目
出版年
2021
计算机应用研究
四川省电子计算机应用研究中心
计算机应用研究
CSTPCD
CSCD
北大核心
影响因子:
0.93
ISSN:
1001-3695
下载
引用
认领
参考文献量
8
段落导航
相关论文
摘要
关键词
引用本文
基金项目
出版年
参考文献
引证文献
同作者其他文献
同项目成果
同科学数据成果