一种考虑隐私保护的深度强化学习任务分配模型

Task Allocation Model Based on Deep Reinforcement Learning Considering Privacy Protection

杨明川 ¹朱敬华 ²李元婧 ¹奚赫然²

扫码查看

作者信息

1. 黑龙江大学计算机科学与技术学院哈尔滨 150006
2. 黑龙江大学计算机科学与技术学院哈尔滨 150006;数据库与并行计算重点实验室(黑龙江大学) 哈尔滨 150006
折叠

摘要

移动群智感知(mobile crowdsensing,MCS)是利用大规模移动智能设备进行数据收集、数据挖掘和智能决策的新范式,高效的任务分配方法是MCS获得高性能的关键.传统的贪婪算法或蚂蚁算法假设工人和任务固定,不适用于工人和任务的位置、数量和时间动态变化的场景.而且,现有任务分配方法通常由中央服务器收集工人和任务的信息进行决策,容易导致工人隐私泄露.因此,提出具有隐私保护的深度强化学习(deep reinforcement learning,DRL)模型来获得优化的任务分配策略.首先,将任务分配建模为多目标优化的动态规划问题,旨在最大化工人和平台的双向收益,实现纳什均衡.其次,提出基于DRL的近端策略优化(proximal policy optimization,PPO)模型进行训练,学习模型参数.最后,通过本地差分隐

关键词

移动群智感知/任务分配/深度强化学习/本地差分隐私/动态规划

Key words

mobile crowdsensing/task allocation/deep reinforcement learning/local differential privacy/dynamic programming

引用本文复制引用

基金项目

黑龙江省自然科学基金-联合引导项目(LH2022F045)

出版年

2023

计算机研究与发展

中国科学院计算技术研究所中国计算机学会

计算机研究与发展

CSTPCDCSCD北大核心

影响因子：2.649

ISSN：1000-1239

参考文献量1

段落导航