国家学术搜索
登录
注册
中文
EN
首页
|
改进的k-means聚类算法在公交IC卡数据分析中的应用研究
改进的k-means聚类算法在公交IC卡数据分析中的应用研究
引用
认领
扫码查看
点击上方二维码区域,可以放大扫码查看
原文链接
NETL
NSTL
万方数据
维普
中文摘要:
针对传统k-means算法中初始聚类中心随机确定的问题,提出k-means改进算法.首先,定义变量权值,权值的大小等于样本密度乘以簇间距离除以簇内样本平均距离,通过最大权值来确定聚类中心,克服了随机确定聚类中心的不稳定性.然后在Hadoop平台上用Map-Reduce框架下实现算法的并行化.最后以南通公交IC刷卡记录为例,通过改进的k-means聚类算法进行IC卡刷卡记录的分析.实验表明,在Hadoop平台下改进k-means算法运行稳定、可靠,具有很好的聚类效果.
外文标题:
Study on the Application of Improved K-means Clustering Algorithm in the Data Analysis of Bus IC Cards
收起全部
展开查看外文信息
作者:
杨健兵
展开 >
作者单位:
南通科技职业学院,江苏 南通 226007
关键词:
MapReduce
改进k-means算法
k-means
聚类
基金:
南通市科技资助项目
项目编号:
MS12017026-4
出版年:
2019
软件工程
东北大学 大连东软信息学院
软件工程
影响因子:
0.527
ISSN:
2096-1472
年,卷(期):
2019.
22
(5)
被引量
2
参考文献量
5