首页|基于强化学习TD3算法的投资组合管理

基于强化学习TD3算法的投资组合管理

扫码查看
针对投资组合管理问题,设计一种基于深度强化学习TD3(Twin Delayed Deep Deterministic policy gradient algo-rithm)双延迟确定性策略梯度算法的投资组合框架,投资者通过观察股票的因子信息做出决策以达到终期收益最大.因子选择上采用LGBM方法选取有效因子,模型训练过程通过数据增强的方法加强对环境的探索能力.选取两组股票做为风险资产,TD3策略在测试时期的年化收益均超过60%,夏普比率均超过2,综合来看TD3策略收益、风险控制、稳定性方面都要显著优于其他对照组(等权重、沪深300指数和DDPG策略),表明该策略在风险与收益的综合指标下有效.
Portfolio Management Based on TD3 Algorithm of Reinforcement Learning

陈浩、时正华

展开 >

河海大学理学院 南京 211100

深度强化学习 投资组合 量化投资

国家自然科学基金面上项目

61773152

2022

计算机与数字工程
中国船舶重工集团公司第七0九研究所

计算机与数字工程

CSTPCD
影响因子:0.355
ISSN:1672-9722
年,卷(期):2022.50(11)
  • 19