首页|基于分组和IGSA的并行密度聚类算法

基于分组和IGSA的并行密度聚类算法

扫码查看
针对并行密度聚类算法在处理大数据集时存在伸缩困难、参数寻优能力不佳、并行化效率较低等问题,提出一种基于分组和重力搜索优化算法(improve gravitational search algorithm,IGSA)的并行密度聚类算法(densi-ty-based clustering algorithm based on groups and improve gravitational search,MR-GDBIGS).首先,该算法设计了基于图形的分组策略(grouping strategy based on pattern,GSP)来有效划分数据,加速邻域搜索,解决了处理大数据集时伸缩困难的问题;其次,在局部聚类中提出基于位置更新函数(position update function,PUF)的重力搜索优化算法,动态寻找局部聚类中的最优参数,提升了局部聚类的效果;最后,提出基于覆盖树的并行局部簇合并策略(cluster merging strategy by using MapReduce,MR-CTMC),在实现局部簇并行化合并的同时加快了合并局部簇的收敛速度,提升了算法整体的并行化效率.实验结果表明,MR-GDBIGS算法在处理大数据时的聚类效果更佳,且并行化性能更好.
Density-based clustering algorithm based on groups and improve gravitational search

胡春安、王家欣、毛伊敏

展开 >

江西理工大学信息工程学院,江西赣州341000

大数据 密度聚类算法 基于图形的分组策略 重力搜索优化算法 MR-CTMC策略

国家重点研发计划资助项目国家自然科学基金资助项目国家自然科学基金资助项目江西省教育厅科技项目

2018YFC15047054156201961762046GJJ209407

2021

计算机应用研究
四川省电子计算机应用研究中心

计算机应用研究

CSTPCDCSCD北大核心
影响因子:0.93
ISSN:1001-3695
年,卷(期):2021.38(11)
  • 2
  • 3