摘要
物联网(Internet of Things,IoT)通过互联网将物理世界中大量无处不在的、互联的、智能的设备集成在一起,使各种智能物联网应用成为可能。为了支持计算密集和时延敏感的智能物联网应用,研究者们对以远程云为核心的移动云计算进行扩展提出一种新的计算网络架构,即移动边缘网络(Mobile Edge Network,MEN)。其核心思想是将计算、存储和通信等资源部署到网络边缘,就近提供服务以保障用户的服务质量。其中,动态资源管控技术凭借高效灵活的特点成为了提升移动边缘网络性能的关键技术。然而,由于移动边缘网络所服务的应用涉及海量高价值数据,且边缘设备具有开放性、移动性和交互性等特点,动态资源管控过程极易引发隐私泄露问题。为此,本文面向移动边缘网络,研究具有隐私保护的动态资源管控技术,以期达到满足用户服务质量和保证隐私安全两方面的要求。本文的主要研究内容概括如下: (1)提出了一种具有低成本隐私保护的动态资源管控策略。针对由云服务器、单个边缘节点和多个移动终端设备组成的基本移动边缘网络系统,考虑边缘节点管控资源以处理随机到达的任务,同时存在恶意攻击者窃听其处理过程引发隐私问题。首先,将边缘节点的动态资源管控问题构建为以最小化长期累积成本为目标的优化问题,并将其建模为马尔可夫决策过程模型。为了求解此模型同时保证隐私安全,提出了一种基于差分隐私深度Q学习的资源管控(DP-DQM)算法。该算法将满足差分隐私定义的噪声机制引入深度Q网络中,仅为输出的决策添加噪声从而降低了隐私保护带来的成本。此外,理论分析了DP-DQM算法的隐私保证和效用保证(学习误差上界)。最后,仿真结果验证所提出的算法能在实现隐私保护的同时,性能与深度Q学习算法相当。 (2)提出了一种具有全局性隐私保护的动态资源协同管控策略。针对由云服务器、多个边缘节点和多个移动终端设备组成的完整移动边缘网络系统,同时存在隐私要求使得边缘节点无法直接传输原始用户数据至云或其他边缘节点,考虑各边缘节点协同管控资源以提高系统整体的服务质量。首先,将多个边缘节点的动态资源管控问题构建为以最小化平均累积成本为目标的优化问题,并将其建模为马尔可夫决策过程模型。其次,结合联邦学习框架和DP-DQM算法,提出了基于联邦差分隐私深度Q学习的资源管控(FDP-DQM)算法。该算法将各边缘节点视为本地客户机使用DP-DQM算法训练本地模型,并上传模型至云服务器聚合得到具有全局特征的公共模型后,共享给各边缘节点,以实现资源协同管控的同时保证全局的隐私安全。此外,理论分析了FDP-DQM算法的隐私保证和效用保证(学习误差上界)。最后,仿真结果验证了FDP-DQM算法在实现全局隐私保护的同时,能达到与未考虑协作隐私安全的CDP-DQM(基于集中式训练的DP-DQM)算法的相同表现。