首页|一种基于属性加权的快速聚类算法

一种基于属性加权的快速聚类算法

扫码查看
传统的聚类算法通常将样本间的距离作为相似度的划分标准,因此距离计算方式的选择对于聚类的结果至关重要.但是传统的距离计算方法忽略了不同数据属性特征对聚类的影响.为了解决此问题,论文结合K-means提出了一种基于属性加权的快速K-means算法FAWK.首先,定义了一个反映属性特征差异的离散度函数对属性特征进行加权;其次,根据加权属性特征计算数据属性间的距离,并将所有属性的加权属性距离求和作为样本间的相似性距离;然后,将加权属性距离作为FAWK算法的划分标准对数据进行聚类;最后,将论文算法与现有方法在8个UCI数据集和LAMOST恒星光谱数据集进行实验测试与分析,实验结果表明FAWK算法具有迭代次数少、运行时间短、聚类结果准确率高且更接近真实数据集划分情况的特点.
A Fast Clustering Algorithm Based on Attribute Weighting

赵国伟、蔡江辉、杨海峰、荀亚玲

展开 >

太原科技大学计算机科学与技术学院 太原 030024

K-means 属性加权 离散度函数 相似度度量

国家青年科学基金山西省重点研发项目山西省重点研发项目

61602335201803D121059201903D121116

2021

计算机与数字工程
中国船舶重工集团公司第七0九研究所

计算机与数字工程

CSTPCD
影响因子:0.355
ISSN:1672-9722
年,卷(期):2021.49(5)
  • 1
  • 8