摘要
在工业4.0时代,制造业正面临全面变革,需要通过对制造过程产生的数据进行分析来探索新的制造模式和技术手段适应制造业数字化、网络化和智能化的发展趋势。因此,智能制造中数据分析和机器学习的应用具有重要的理论和现实意义,不仅可以提高制造业效率和质量,而且能促进智能制造战略的实施和企业应用的深化。 生产设备的时间序列数据聚类分析存在的相似性准确度低和冗余数据影响计算效率等问题导致生产设备运行状态识别精度低下。为此,本文提出了一种基于时序数据聚类分析的设备运行状态识别方法。具体研究内容如下: (1)为识别制造业生产设备状态,分析了时间序列分析和工业状态识别领域的研究,总结了时间序列和聚类相关的模型和方法,为后续生产设备的时间序列聚类分析和状态识别提供了理论基础。 (2)针对生产设备的时间序列相似性度量问题,本文首先引入动态时间规整(Dynamic Time Warping, DTW),提出了一种基于k-medoids的DTW-kmedoids聚类算法,并在此基础上构建阈值机制,实现对生产设备的状态识别;然后利用某卷烟厂的数据对本模型进行实验验证。结果表明,DTW-kmedoids是一种有效的生产设备监督和检测方法。 (3)针对由于生产设备数据存在大量噪声、缺失值和无关数据等导致的计算效率不高的问题,本文提出了一种优化评价聚类模型(Optimized Evaluate Cluster, OEC)。该模型采用了一种新的u-shapelets质量度量方法无监督地从时间序列中发现特征,并从原始时间序列中发现潜在的数据状态;然后,通过手肘法确定聚类簇的数量;接着,通过SDTW距离空间进行聚类,提高 u-shapelets集合的整体质量而实现聚类的精度和计算效率的提高。最后,利用某生产设备的时间序列数据集对 OEC模型进行了验证。结果表明,与其它算法相比,OEC 模型对时间序列数据的聚类效果更佳,对生产设备运行状态的识别更加准确。 (4)利用以上研究成果,本文开发了基于时序数据聚类分析的生产设备状态识别系统。该系统可以实现生产设备数据采集、最优子序列提取、相似度计算、聚类分析和状态识别等功能。