国家学术搜索
登录
注册
中文
EN
首页
|
面向大规模日志数据的聚类算法研究
面向大规模日志数据的聚类算法研究
引用
认领
扫码查看
点击上方二维码区域,可以放大扫码查看
原文链接
NETL
NSTL
万方数据
维普
中文摘要:
针对大规模日志数据的聚类问题,提出了DBk-means算法.该算法使用Hadoop对原始日志数据进行预处理,并结合了k-means和DBSCAN聚类算法各自的优势.实验结果表明,相比k-means算法进行聚类分析,文中使用DBk-means算法进行聚类,能够取得更好的聚类效果,正确率可以达到83%以上.
外文标题:
Research on Clustering Algorithm for Large Data Sets
收起全部
展开查看外文信息
作者:
李清、沈彤、关毅
展开 >
作者单位:
哈尔滨工业大学计算机科学与技术学院,哈尔滨150001
关键词:
聚类算法
k-means算法
DBSCAN算法
大规模数据
基金:
国家自然科学基金
项目编号:
60975077
出版年:
2012
智能计算机与应用
哈尔滨工业大学
智能计算机与应用
影响因子:
0.357
ISSN:
2095-2163
年,卷(期):
2012.
2
(5)
被引量
4
参考文献量
1