摘要
针对被控系统的不确定性和非线性特征,提出了一种基于强化学习的随机振动主动控制策略.采用深度确定性策略梯度(DDPG)的强化学习算法设计振动控制器,该过程不涉及专家经验,完全由算法和数据自主交互学习完成.控制器是一个多层神经网络模型,这种由强化学习算法设计的控制器称为RL-NN控制器.通过两个数值仿真算例验证了RL-NN控制器的性能,其中考虑不确定性的单自由度系统主动控制效果达97%,考虑不确定性和非线性的车辆1/4悬架系统半主动控制效果达74%,结果表明RL-NN控制器对不确定性和非线性系统具有优异的振动控制能力.强化学习算法仅仅花费数小时设计的随机振动主动控制策略便优于专家经验数年来设计的控制策略,这为复杂系统振动主动/半主动控制器的设计提供了一种新的实现途径.