摘要
随着人工智能(Artificialintelligence,AI)的快速发展,AI在商业、工程、军事、金融等领域的应用愈加广泛,而其中一个典型的应用场景,就是量化投资领域。量化投资区别于传统的定性投资,是通过计算机的程序化指令并结合一定的数学模型去实现投资策略的过程,它避免了人为的认知偏差和主观臆断。投资市场具有股票众多,指标因子繁杂的特点,通过人力去分析相当困难。而随着机器学习、深度学习等技术逐渐成熟,且计算机算力的大幅度提高,借助AI算法和计算机的强大算力可以帮助投资者处理海量股票数据并且挖掘数据特征,达到更好的投资效果。这将是未来发展的新趋势。 本文着眼于当前市场上火爆的量化投资环境,构建了一套基于机器学习算法的多因子量化选股策略。本文选取了沪深300成分股中流通市值排名前50名的股票作为研究对象,获取其2014年12月到2020年1月共计5年的价格数据用以研究。在选择因子方面,本文查阅了大量文献和券商研报,并参考了由清华大学五道口金融学院发表的《中国A股市场量化因子白皮书》,一共选择了包含财务、技术、基础、情绪、成长、风险、每股、动量和风格因子共计9种类型的优质因子,数量达260种来构建本文的因子池。接着,本文基于最近几年新提出的机器学习算法LightGBM建立预测模型,并结合一种数据处理算法对LightGBM尝试进行优化。同时本文也设置了传统机器学习算法模型如支持向量机和随机森林算法用来作为对照实验。 实验结果表明,LightGBM算法相比于支持向量机和随机森林,预测的准确率和AUC值均有提高,且训练速度大幅提升。我们根据模型的预测结果来构建投资策略,再通过回测验证,最终选出的股票取得了良好的效果。策略收益分别为32.62%、57.41%、39.34%、38.85%和42.43%,相比沪深300基准分别获得了8.12%、41.73%、13.52%、44.78%和21.87%的超额收益,且最大回撤均比较低,证明了本文策略的可行性,同时也为现有的量化投资模型提供了一种新的思路。