摘要
多元时间序列广泛存在于实际复杂系统中,多个变量之间存在着复杂的耦合关系。挖掘出时间序列数据中蕴含的有用信息,对实际复杂系统的分析与建模具有重要意义。本文以复杂系统产生的多元时间序列为研究对象,针对多元时间序列的特征选择、因果关系分析和特征提取问题展开研究,为模型构建合适的输入特征,最终提升模型的精度和计算效率。本文的研究内容包括以下三个方面: (1)针对多元时间序列的特征选择问题,提出全局互信息特征选择方法。该方法将互信息特征选择转化为全局优化问题,应用全局搜索策略进行求解,提出基于单目标和多目标优化的全局互信息特征选择算法,然后根据结合过滤式和封装式的混合特征选择框架确定最优特征子集,为特征选择问题提供一种新的求解思路。此外,针对多变量混沌系统,提出基于联合互信息的非均匀状态空间重构方法。该方法将非均匀嵌入与特征选择相结合,首先推导出低维近似的联合互信息准则,选择状态空间的延迟变量,然后采用条件熵准则确定嵌入维数,具有较高的计算精度和效率。重构的状态空间不仅能够恢复原系统的动力学特性,而且可以有效去除冗余信息。 (2)针对多元时间序列的因果关系分析问题,提出基于Hilbert-Schmidt独立性准则(Hilbert-Schmidt independence criterion,HSIC)-Lasso的非线性Granger因果分析模型。由于传统Granger因果模型仅限于分析二元时间序列的线性因果关系,本文将其扩展至分析多元时间序列的非线性因果关系。该方法首先对原始时间序列进行平稳性检验和状态空间重构,然后将输入和输出样本映射到再生核Hilbert空间中,并建立HSIC-Lasso回归模型,最后根据显著性检验结果确定Granger因果关系。本文方法不仅能够获得准确的非线性因果关系,而且可以同时进行多个输入对输出的因果关系分析,具有较高的计算效率,适合解决高维系统的因果分析问题。 (3)针对时间序列的特征提取问题,提出一种混合特征提取方法。该方法首先根据不同类型的特征提取方法分别提取特征,全面描述时间序列的复杂特性,然后设计基于类可分离性的特征选择算法,为分类模型选择最优特征子集。此外,针对单个极限学习机分类结果不稳定的问题,提出基于线性判别分析的集成极限学习机模型。该模型从数据样本扰动、输入属性扰动和算法参数扰动三方面提升基学习器的多样性,从而提高分类器的泛化性能和结果的稳定性。本文提出的混合特征提取与集成分类器相结合的方法具有很高的分类精度,在医学信号特征提取和分类中具有广阔前景。