计算机技术与发展2020,Vol.30Issue(8) :53-60.DOI:10.3969/j.issn.1673-629X.2020.08.009

一种基于标准差的K-medoids聚类算法

A K-medoids Clustering Algorithm Based on Standard Deviation

邓玉芳 张继福
计算机技术与发展2020,Vol.30Issue(8) :53-60.DOI:10.3969/j.issn.1673-629X.2020.08.009

一种基于标准差的K-medoids聚类算法

A K-medoids Clustering Algorithm Based on Standard Deviation

邓玉芳 1张继福1
扫码查看

作者信息

  • 1. 太原科技大学 计算机科学与技术学院,山西 太原 030024
  • 折叠

摘要

K-me doids聚类分析具有对孤立点敏感度较低和良好的鲁棒性等特点,但由于初始聚类中心的选取和中心点迭代更新等,聚类精度和效率较低.文中根据标准差体现数据离散程度,定义了初始中心点候选集,给出了一种基于标准差的K-medoids聚类算法.该算法首先利用标准差定义了初始中心点候选集,并采用逐步增加的方式确定初始中心点,从而保证了选取密集程度较大的样本点作初始聚类中心点,同时避免选取到密集程度较低的样本点尤其是孤立点作为初始中心点;其次,按照数据样本归属于最近的中心点的原则,形成初始聚类簇,不断更新聚类中心点,直到聚类误差平方和相同为止,形成聚类簇;最后,在UCI数据集和人工数据集上的实验验证了该聚类算法具有良好的聚类精度、效率和鲁棒性.

关键词

K-medoids聚类算法/初始中心点/标准差/UCI数据集

引用本文复制引用

基金项目

国家自然科学基金(61876122)

出版年

2020
计算机技术与发展
陕西省计算机学会

计算机技术与发展

CSTPCD
影响因子:0.621
ISSN:1673-629X
被引量4
参考文献量16
段落导航相关论文