摘要
随着国内金融市场的发展,股票市场在中国经济体系中占据着越来越重要的地位,越来越多的人开始参与股票投资。而股票价格的剧烈波动将会给投资者们带来经济损失,在极端情况下甚至会破坏原有市场平衡,影响社会经济的发展。因此对股票价格走势的预测研究具有非常大的应用价值。股票价格序列具有非线性、高噪声、非平稳的特征,传统的统计学模型难以充分捕捉到数据中的非线性关系,使用前还需要对数据进行假设性检验。与传统方法相比,深度学习具有强大的非线性特征提取能力,能够从复杂的股票数据中挖掘到更重要、更深层次的信息。 本文以深度学习理论为基础,探索了深度学习在股指预测上的可行性。主要研究工作如下: (1)构建了基于主成分分析(Principal component analysis,PCA)的长短期记忆(Long short–term memory,LSTM)神经网络的混合股指预测模型。该模型以LSTM为基础,添加了PCA技术对输入数据进行降维处理。LSTM内部的记忆存储单元以及循环结构非常适合用来分析时间序列,可以学习到股指数据内的动态变化信息。PCA用来对本实验中的高维输入进行特征降维,去除噪声以及冗余信息,提高模型的特征提取能力。 (2)引入互补集成经验模态分解(Complementary ensemble empirical mode decomposition,CEEMD)技术对股指序列进行预处理分解,构建了基于CEEMD的PCA-LSTM股指预测模型。由于上证指数日收盘价序列是非线性、高噪、非平稳的,采用CEEMD技术自适应地将上证指数进行分解,可以得到具有不同时间尺度波动特征的子序列;再采用游程判定法对其重构成高频分量、低频分量与残余项Res;最后再对这3条子序列分别进行预测,从而降低模型预测的难度。 (3)在CEEMD-PCA-LSTM模型的基础上融入了基于时间(Temporal)和空间(Spatial)的注意力机制(Attention),提出了改进模型。使得模型在时间与空间两个维度上,按照输入序列对最终结果的影响程度,赋予不同的注意力权重。从而使得网络关注更加重要的值,增加重要信息对预测结果的影响,进一步提升了LSTM模型学习数据间长期依赖关系的能力。 本文设置了4组对比模型,包括了LSTM预测模型、PCA-LSTM预测模型、CEEMD-LSTM预测模型和CEEMD-PCA-LSTM预测模型。将本文预测模型与对比模型进行对比分析,评判本文所构建模型的预测性能。实验结果表明,本文设计的模型与对比模型相比,均获得了更高的预测精度,具有更强的预测性能。与其中表现最好的CEEMD-PCA-LSTM模型相比,MSE误差减少了66.16%,MAE减少了46.52%,R-Squared提升了4.75%。这充分体现了本文模型对于上证指数预测的优良性能,证明了本文提出的股指预测思路是可行的,即基于分解-降维-注意力机制的深度学习建模方法。通过本文模型,可以实现对下一个交易日的收盘股指的预测,对于指导股票交易也有一定的意义。