基于多尺度分解与深度学习的股指预测模型研究

何迪原¹

扫码查看

作者信息

1. 江西财经大学
折叠

摘要

随着国内金融市场的发展，股票市场在中国经济体系中占据着越来越重要的地位，越来越多的人开始参与股票投资。而股票价格的剧烈波动将会给投资者们带来经济损失，在极端情况下甚至会破坏原有市场平衡，影响社会经济的发展。因此对股票价格走势的预测研究具有非常大的应用价值。股票价格序列具有非线性、高噪声、非平稳的特征，传统的统计学模型难以充分捕捉到数据中的非线性关系，使用前还需要对数据进行假设性检验。与传统方法相比，深度学习具有强大的非线性特征提取能力，能够从复杂的股票数据中挖掘到更重要、更深层次的信息。本文以深度学习理论为基础，探索了深度学习在股指预测上的可行性。主要研究工作如下： (1)构建了基于主成分分析(Principal component analysis，PCA)的长短期记忆(Long short–term memory，LSTM)神经网络的混合股指预测模型。该模型以LSTM为基础，添加了PCA技术对输入数据进行降维处理。LSTM内部的记忆存储单元以及循环结构非常适合用来分析时间序列，可以学习到股指数据内的动态变化信息。PCA用来对本实验中的高维输入进行特征降维，去除噪声以及冗余信息，提高模型的特征提取能力。 (2)引入互补集成经验模态分解(Complementary ensemble empirical mode decomposition，CEEMD)技术对股指序列进行预处理分解，构建了基于CEEMD的PCA-LSTM股指预测模型。由于上证指数日收盘价序列是非线性、高噪、非平稳的，采用CEEMD技术自适应地将上证指数进行分解，可以得到具有不同时间尺度波动特征的子序列；再采用游程判定法对其重构成高频分量、低频分量与残余项Res；最后再对这3条子序列分别进行预测，从而降低模型预测的难度。 (3)在CEEMD-PCA-LSTM模型的基础上融入了基于时间(Temporal)和空间(Spatial)的注意力机制(Attention)，提出了改进模型。使得模型在时间与空间两个维度上，按照输入序列对最终结果的影响程度，赋予不同的注意力权重。从而使得网络关注更加重要的值，增加重要信息对预测结果的影响，进一步提升了LSTM模型学习数据间长期依赖关系的能力。本文设置了4组对比模型，包括了LSTM预测模型、PCA-LSTM预测模型、CEEMD-LSTM预测模型和CEEMD-PCA-LSTM预测模型。将本文预测模型与对比模型进行对比分析，评判本文所构建模型的预测性能。实验结果表明，本文设计的模型与对比模型相比，均获得了更高的预测精度，具有更强的预测性能。与其中表现最好的CEEMD-PCA-LSTM模型相比，MSE误差减少了66.16%，MAE减少了46.52%，R-Squared提升了4.75%。这充分体现了本文模型对于上证指数预测的优良性能，证明了本文提出的股指预测思路是可行的，即基于分解-降维-注意力机制的深度学习建模方法。通过本文模型，可以实现对下一个交易日的收盘股指的预测，对于指导股票交易也有一定的意义。

关键词

股票市场/股指预测/多尺度分解/深度学习

引用本文复制引用

授予学位

硕士

学科专业

电子与通信工程

导师

党建武

学位年度

2022

学位授予单位

江西财经大学

语种

中文

中图分类号

段落导航