摘要
针对工业机器人运动控制中存在训练成本高和安全风险高的问题,使用数字孪生对工业机器人进行数字化表征,在数字孪生空间中训练控制策略,并迁移控制策略用于真实工业机器人的任务作业,主要研究包括以下几个方面: (1)构建了工业机器人的数字孪生系统。将系统设计为四个模块:应用模块、物理空间模块、数据存储模块、数字孪生空间模块,以数据存储模块为中心,实现了实时性和强一致性数据的采集、传输和存储。根据实时数据和三维数据建立了工业机器人的数字孪生体,进行可视化表达,并提供用户交互界面。 (2)研究了基于深度强化学习的工业机器人抓取控制算法。针对非结构化环境中物体的抓取问题,引入推动动作辅助抓取,根据推动和抓取动作价值网络计算动作回报值,使用动作策略网络选择执行的动作,从而实现动作的协同。在推动价值网络中,使用基于四叉树的物体散度计算方法,根据执行推动动作前后的散度变化计算推动奖励。在数字孪生体上训练控制算法,降低了成本与风险,提高了抓取成功率和平均完成率。 (3)研究了基于物体运动传播预测网络的推动动作策略迁移方法。为了减小在数字孪生空间与真实环境之间物体运动的位置误差,基于图神经网络构建物体运动传播预测网络,拟合物体的物理属性,并通过多次迭代计算来预测真实环境中物体的位置变化,以此代替真实环境中的推动交互。为了给每个推动实例找到合适的微调策略,使用基于差分进化的自适应微调方法迁移推动动作价值网络,从而提升控制策略的动作效率。 在数字孪生空间和真实环境中的抓取对比实验表明,在物体随机放置和固定放置方式下,本研究的推动和抓取协同控制算法,其抓取成功率和平均完成率均排名第一。 在真实环境中的策略迁移对比实验表明,相对于直接应用控制策略,本研究的策略迁移方法使动作效率提升了5.4%(物体随机放置)和8.9%(物体固定放置)。