计算机应用研究2021,Vol.38Issue(11) :3293-3299.DOI:10.19734/j.issn.1001-3695.2021.05.0148

基于分组和IGSA的并行密度聚类算法

Density-based clustering algorithm based on groups and improve gravitational search

胡春安 王家欣 毛伊敏
计算机应用研究2021,Vol.38Issue(11) :3293-3299.DOI:10.19734/j.issn.1001-3695.2021.05.0148

基于分组和IGSA的并行密度聚类算法

Density-based clustering algorithm based on groups and improve gravitational search

胡春安 1王家欣 1毛伊敏1
扫码查看

作者信息

  • 1. 江西理工大学信息工程学院,江西赣州341000
  • 折叠

摘要

针对并行密度聚类算法在处理大数据集时存在伸缩困难、参数寻优能力不佳、并行化效率较低等问题,提出一种基于分组和重力搜索优化算法(improve gravitational search algorithm,IGSA)的并行密度聚类算法(densi-ty-based clustering algorithm based on groups and improve gravitational search,MR-GDBIGS).首先,该算法设计了基于图形的分组策略(grouping strategy based on pattern,GSP)来有效划分数据,加速邻域搜索,解决了处理大数据集时伸缩困难的问题;其次,在局部聚类中提出基于位置更新函数(position update function,PUF)的重力搜索优化算法,动态寻找局部聚类中的最优参数,提升了局部聚类的效果;最后,提出基于覆盖树的并行局部簇合并策略(cluster merging strategy by using MapReduce,MR-CTMC),在实现局部簇并行化合并的同时加快了合并局部簇的收敛速度,提升了算法整体的并行化效率.实验结果表明,MR-GDBIGS算法在处理大数据时的聚类效果更佳,且并行化性能更好.

关键词

大数据/密度聚类算法/基于图形的分组策略/重力搜索优化算法/MR-CTMC策略

引用本文复制引用

基金项目

国家重点研发计划资助项目(2018YFC1504705)

国家自然科学基金资助项目(41562019)

国家自然科学基金资助项目(61762046)

江西省教育厅科技项目(GJJ209407)

出版年

2021
计算机应用研究
四川省电子计算机应用研究中心

计算机应用研究

CSTPCDCSCD北大核心
影响因子:0.93
ISSN:1001-3695
被引量2
参考文献量3
段落导航相关论文