摘要
移动群智感知(mobile crowdsensing,MCS)是利用大规模移动智能设备进行数据收集、数据挖掘和智能决策的新范式,高效的任务分配方法是MCS获得高性能的关键.传统的贪婪算法或蚂蚁算法假设工人和任务固定,不适用于工人和任务的位置、数量和时间动态变化的场景.而且,现有任务分配方法通常由中央服务器收集工人和任务的信息进行决策,容易导致工人隐私泄露.因此,提出具有隐私保护的深度强化学习(deep reinforcement learning,DRL)模型来获得优化的任务分配策略.首先,将任务分配建模为多目标优化的动态规划问题,旨在最大化工人和平台的双向收益,实现纳什均衡.其次,提出基于DRL的近端策略优化(proximal policy optimization,PPO)模型进行训练,学习模型参数.最后,通过本地差分隐
基金项目
黑龙江省自然科学基金-联合引导项目(LH2022F045)