首页|面向大规模日志数据的聚类算法研究

面向大规模日志数据的聚类算法研究

扫码查看
针对大规模日志数据的聚类问题,提出了DBk-means算法.该算法使用Hadoop对原始日志数据进行预处理,并结合了k-means和DBSCAN聚类算法各自的优势.实验结果表明,相比k-means算法进行聚类分析,文中使用DBk-means算法进行聚类,能够取得更好的聚类效果,正确率可以达到83%以上.
Research on Clustering Algorithm for Large Data Sets

李清、沈彤、关毅

展开 >

哈尔滨工业大学计算机科学与技术学院,哈尔滨150001

聚类算法 k-means算法 DBSCAN算法 大规模数据

国家自然科学基金

60975077

2012

智能计算机与应用
哈尔滨工业大学

智能计算机与应用

影响因子:0.357
ISSN:2095-2163
年,卷(期):2012.2(5)
  • 4
  • 1