基于强化学习TD3算法的投资组合管理

扫码查看

原文链接

国家科技期刊平台
NETL
NSTL
万方数据
维普

中文摘要：针对投资组合管理问题,设计一种基于深度强化学习TD3(Twin Delayed Deep Deterministic policy gradient algo-rithm)双延迟确定性策略梯度算法的投资组合框架,投资者通过观察股票的因子信息做出决策以达到终期收益最大.因子选择上采用LGBM方法选取有效因子,模型训练过程通过数据增强的方法加强对环境的探索能力.选取两组股票做为风险资产,TD3策略在测试时期的年化收益均超过60％,夏普比率均超过2,综合来看TD3策略收益、风险控制、稳定性方面都要显著优于其他对照组(等权重、沪深300指数和DDPG策略),表明该策略在风险与收益的综合指标下有效.

外文标题：Portfolio Management Based on TD3 Algorithm of Reinforcement Learning

作者：

陈浩、时正华

展开 >

作者单位：

河海大学理学院南京 211100

关键词：

深度强化学习投资组合量化投资

基金：

国家自然科学基金面上项目

项目编号：

61773152

出版年：

2022

DOI：

10.3969/j.issn.1672-9722.2022.11.002

计算机与数字工程

中国船舶重工集团公司第七0九研究所

计算机与数字工程

CSTPCD

影响因子：0.355

ISSN：1672-9722

年,卷(期)：2022.50(11)

参考文献量19