首页|数据挖掘在校园卡消费中的研究与应用

数据挖掘在校园卡消费中的研究与应用

张红蕾

数据挖掘在校园卡消费中的研究与应用

张红蕾1
扫码查看

作者信息

  • 1. 兰州交通大学
  • 折叠

摘要

近年来,校园信息化已成为一种主流的趋势,尤其是高校已经将校园一卡通作为校园信息化建设的主要载体,利用校园一卡通可以实现多种功能。无论上网、用餐、购物,每天都会产生大量的消费数据,在这些杂乱无章的数据中隐藏着很多有价值的消费规则或者信息,而这些信息对高校管理具有着重要的意义,因此如何把这些有价值的信息挖掘出来则成了当今关注的热点话题。数据挖掘技术的出现为解决这一难题提供了技术支撑。 在学习研究DM和WEKA平台的基础上,通过对兰州交通大学本科生消费流水数据进行聚类和关联等操作,来挖掘出学生的消费行为特征,并关联贫困生库中的数据对学生贫困补助的发放作出评估。从而向学校相关部门提供可供参考的信息。论文主要从以下几个方面进行研究分析: (1)针对传统的K-means聚类算法对k值和初始中心点选取的过分依赖,本文提出一种改进的VW-K-means聚类算法。首先在算法初始阶段通过构造Voronoi图自适应的产生较优的k值;其次,为了减少算法对噪声数据的敏感性,避免低密度大簇边缘的数据对象误划分到高密度小簇中,在基于加权平均值法的准则函数上加入权重系数值来有效地将数据对象进行划分,降低误划分几率。针对UCI数据集和校园卡流水数据集聚类,实验验证了改进的VW-K-means算法的聚类精度更高,算法收敛更快,达到全局最优,改善了传统算法的性能。 (2)本文选取了2014年3月至2014年7月我校本科生校园卡流水数据进行挖掘研究,起初大量的工作在于对数据进行预处理操作,之后基于挖掘算法对处理后的数据做出应用分析。 首先,针对食堂就餐人数、学生就餐选择和学生消费行为进行统计分析,将统计结果与聚类分析的结果进行结合比较,便于研究分析更加精准。 其次,基于WEKA平台利用VW-K-means算法从两方面挖掘分析:一方面对学校食堂就餐人数聚类分析,从而学校食堂可以依据此数据进行合理的规划,尽量避免食堂拥挤以及饭菜的浪费;另一方面对学生的消费水平聚类分析,从而将消费水平进行合理的消费区间划分,为关联规则的研究做铺垫。 最后,基于WEKA平台利用Apriori算法主要将学生在校消费情况与实际贫困生库的情况进行关联,挖掘其中的隐含联系。并将学生消费水平分为三类,利用基于WEKA平台的J48分类器对学生贫困补助情况进行预测评估,为我校相关部门的决策提供可供参考的数据依据。

关键词

高校管理/校园卡/数据挖掘/消费行为/K-means聚类

引用本文复制引用

授予学位

硕士

学科专业

软件工程

导师

屈洪/李春明

学位年度

2016

学位授予单位

兰州交通大学

语种

中文

中图分类号

TP
段落导航相关论文