首页|K-means聚类算法研究及应用

K-means聚类算法研究及应用

扫码查看
数据挖掘技术是一门融合了数据库、机器学习和AI等众多领域的交叉学科,能够从无序、杂乱和大量的数据集中挖掘出我们所需要的信息。聚类分析是数据挖掘领域最为重要的技术之一,至今已在理论和方法上取得了丰硕的研究成果。聚类已经被广泛的研究了许多年,主要集中在基于距离的聚类算法上,其中以K-均值聚类算法最为经典。 K-means算法被认为是聚类中最重要的无监督机器学习方法。它是一种划分聚类算法,将全部数据分为k个相互差异很大的子类,通过不断的迭代,使得k-means算法中每个数据对象到其所在的子类的中心点的距离最小。由于k-means算法具有简单易行和效率高等优点,它被广泛应用于数据压缩、图像分割、市场营销、异常数据分析以及统计学科等领域。但是,k-means算法仍然存在一定的局限性,例如:对初始聚类中心极为敏感,如果初始聚类中心选择不当,算法很容易陷入局部最优解,而非全局最优解。 本文主要深入研究和分析了聚类算法中的经典K-means聚类算法,总结出其优点和不足。考虑到K-means算法简单、快速的特性,在本文中将K-means算法应用于视频目标的跟踪技术中。针对K-means算法对初始中心值选取的依赖性,我们提出了一种新的初始中心值选取方法,并用大量的实验验证了随机选取初始值对聚类结果的影响性。 具体研究内容和工作成果如下: (1)在本文中将K-means算法应用于视频目标的跟踪技术中,首先通过对视频图像的背景像素点建立样本模型,然后利用聚类的特性对样本进行划分,用来模拟物体的相关动作特征。并根据背景像素点的样本模型对视频帧中的相关像素点进行检测,检查出图像帧中存在的背景点。针对图像中相关像素点在样本模型中所划分的类对样本模型进行更新,从而达到提高图像背景检测的有效性。 (2)本文通过利用均值漂移的快速局部收敛特性和分区域的全局划分特点对初始中心点进行了优化,能够在一定程度上减少算法的整体迭代次数,降低算法的复杂度,增强算法的全局性和稳定性。实验结果证明,新的改进算法能够增强结果的稳定性,提高数据聚类分组的准确度。

罗有志

展开 >

视频目标 K-means聚类算法 动作特征 目标跟踪

硕士

计算机应用技术

徐蔚鸿

2016

长沙理工大学

中文

TP