摘要
自2010年我国第一个股指期货合约——沪深300股指期货上市以来,我国的股指期货经历了繁荣到被严格限制再到平稳发展的阶段,如今已有4种股指期货上市交易。随着市场上的机构投资者越来越多,整个市场的交易氛围越来越偏理性,股指期货越来越多地被作为风险对冲的金融工具。股指反映着整个宏观经济以及股市的整体运行情况,因而跟踪股指现货的股指期货的价格运行也能够反映宏观经济,对于建立了现货资产头寸的交易者来说,股指期货是对冲系统性风险的理想的对冲工具。 股指期货的重要性决定了对股指期货的价格预测研究的重要性。研究以上证50股指的成分股、股指现货以及股指期货作为研究对象,基于其样本时间间隔为3s的价格数据,尝试分别从传统时间序列模型的角度和新兴的机器学习的角度去建立股指期货的价格预测模型,并对模型之间的优劣进行比较。对于上证50的成分股,研究利用中证一级行业分类来将50个成分股价格序列合成为10个行业价格指数序列,从而减少变量和特征,降低模型复杂度。 两种建模思路均采用滚动窗口的方式进行。对于VAR模型,采用窗口长度为200个样本,步长为1个样本的滚动窗口,窗口内价格序列转化为对数收益率,利用Granger因果分析筛选出是股指期货价格序列的Granger原因的行业价格指数序列,加入VAR模型,拟合模型后直接做一步的预测。对于机器学习部分,研究选用逻辑回归、随机森林和XGBoost三种模型,选用均线指标、动量指标和RSI指标,每个时间序列均构建9个特征,并生成训练目标。以3天数据训练机器学习模型,并利用贝叶斯优化对参数进行优化,滚动步长为1天,从而得到每种机器学习的系列模型。 从模型的整体评价来看,滚动窗口的VAR模型和机器学习模型均有一定的预测效果,机器学习模型在部分评价指标优于滚动窗口的VAR模型,但滚动窗口的VAR模型的整体评价更为均衡。在三种机器学习模型中,基于随机森林的系列模型在整体评价上取得了最好的表现。从简单回测的结果来看,机器学习模型全部优于滚动窗口的VAR模型,同时逻辑回归是回测表现最好的机器学习模型,在盈利点数、次均盈利和胜率方面都取得了最好的表现。回测结果与整体评价指标的不一致也表明,不能通过简单的预测指标计算评价模型的优劣,回测结果或许更加重要。