摘要
随着大数据技术的发展与应用,各行各业积累了海量的历史数据,为基于数据的智能分析应用打下了坚实基础。遥感领域经过多年的终端、数据中心以及平台应用方面的建设,积累了海量、多源、多分辨率、多时相的遥感数据,依据专家判断以及人工特征的智能目标分析已经成为制约领域发展的瓶颈。深度学习技术在图像处理领域取得了长足进展,其中以卷积神经网络为代表的图像分类、目标检测识别等算法也在遥感领域中大规模应用。深度卷积神经网络类算法带来了目标分析的高准确率,同时也对算力、平台功耗提出了更高韵要求。 本文以遥感领域影像智能分析应用的需求出发,从软硬件协同计算角度解决目标检测、图像分类以及少样本学习等关键技术应用中存在的高准确率、高吞吐量以及低功耗的计算需求。在保持软硬件卷积网络模型一致的情况下,维持目标识别的准确率与一致性响应。同时从硬件加速器设计的角度,突破浮点卷积计算的吞吐量损耗,提升浮点卷积神经网络相关算法的计算吞吐量与能效。本文的主要贡献与创新点如下: (1)提出了一种基于YOLO目标检测方法的轻量型卷积神经网络模型,有效的解决了遥感影像机场目标识别的高准确率、高速度的处理需求。针对常规浮点卷积乘累加计算的吞吐量损耗,设计了基于前向累加链的浮点卷积乘累加计算阵列。通过基于FPGA的浮点目标检测模型加速,达到了功耗受限环境下实时高准确率的计算需求,显著提升了遥感影像机场目标识别的速度。 (2)提出了一种基于MobileNet的浮点可分离卷积神经网络加速方法,有效的解决了遥感影像飞机型号目标识别的高准确率、高能效的处理需求。采用轻量型网络MobileNet构建型号分类模型,有效的解决了目标识别的准确率。设计了基于数据流调度的深度分离卷积计算阵列,有效的解决了深度分离卷积乘累加计算的吞吐量损耗,显著提升了遥感影像飞机型号目标识别的准确率和能效。 (3)提出了一种软硬件协同加速的关系网络推理优化方法,支持遥感领域特定设施及装备目标等少样本情况下的目标识别的高能效处理需求。设计了基于软硬件协同加速处理的关系网络计算流程,充分利用通用平台提取支持集特征,为后续推理计算节约计算能耗及提升处理速度。设计了一种基于异构多核的关系网络推理计算片上处理系统,有效的提升了处理的并行度并且保持FPGA综合设计的收敛。 实验数据表明,本文提出的机场目标检测识别加速方法平均准确率达到97.59%,在FPGA平台上达到了2802.08FPS的处理速率,处理速度达到了GPU的22倍;本文提出的飞机目标型号分类加速方法Top-1准确率和Top-5准确率分别达到了96.1%及99.5%以上,计算速度达到了GPU的1.10~2.61倍,计算效能是GPU的7.44~18.66倍;本文提出的关系网络加速方法在FPGA平台的Omniglot28加速器和miniImagenet84加速器功耗为15.867W和12.359W,单批次加速比为GPU的2.5~17.2倍和3.1~3.4倍。经验证,本文提出的加速方法在计算吞吐量、计算效能、模型响应的一致性等方面有突出优势,支持各类平台包括近数据端以及数据中心处理遥感影像目标识别相关应用。