计算机技术与发展2020,Vol.30Issue(8) :61-65,72.DOI:10.3969/j.issn.1673-629X.2020.08.010

不完整数据聚类算法研究

Research on Clustering Algorithm of Incomplete Data

冷泳林 孙晓红
计算机技术与发展2020,Vol.30Issue(8) :61-65,72.DOI:10.3969/j.issn.1673-629X.2020.08.010

不完整数据聚类算法研究

Research on Clustering Algorithm of Incomplete Data

冷泳林 1孙晓红2
扫码查看

作者信息

  • 1. 渤海大学 信息科学与技术学院,辽宁 锦州 121000
  • 2. 渤海大学 管理学院,辽宁 锦州 121000
  • 折叠

摘要

服务类电子政务通过单向或互动的方式向社会和公民提供诸如天气、统计数据、道路交通等信息.这些服务类信息在数据采集过程中,不可避免地会出现各种各样的数据质量问题,数据的不完整性就是其中一种.数据的不完整性对后续的信息统计、挖掘都会造成严重影响.以不完整数据为研究对象,在分析了当前不完整数据聚类算法存在问题的基础上,提出一种基于KNN的不完整数据AP聚类算法.算法首先给出了连续数值型和分类型数据的相似性度量方法,然后利用AP聚类算法对数据集中的完整数据进行聚类,最后利用KNN思想将完整数据集中的吸引度矩阵和归属度矩阵扩展至整个数据集,继续执行迭代,直至收敛.实验将该算法同其他不完整数据聚类算法在聚类精度上进行比较,验证了提出的不完整数据聚类算法的有效性.

关键词

电子政务/不完整数据/聚类/相似度/KNN/数据离散

引用本文复制引用

基金项目

辽宁省社会科学基金(L14AGL002)

辽宁省社会科学基金(L13AGL002)

辽宁省教育项目(LQ2017004)

出版年

2020
计算机技术与发展
陕西省计算机学会

计算机技术与发展

CSTPCD
影响因子:0.621
ISSN:1673-629X
参考文献量5
段落导航相关论文