基于深度学习的无人机图像语义分割算法研究

韩柏迅¹

扫码查看

作者信息

1. 西安石油大学
折叠

摘要

无人机自主环境感知技术具备快速监控和分析特定位置及时刻下复杂环境的能力，为交通监控、人口密度监控和城市绿化监控等应用提供了必要的技术支持和数据基础。现有研究主要集中在无人机视觉下的目标检测和大型房屋分割任务方面，而对于低空无人机视觉下的实时图像语义分割任务，仍缺乏较好的解决方案。此外，为了提高精度，当前的无人机视觉图像语义分割相关研究往往采用复杂冗余模型，但在实现“高精度”与“低延迟”两者兼顾方面仍存在挑战。针对上述问题，本文对无人机视觉实时图像语义分割技术进行研究，主要内容为: (1)本文首先以验证轻量级图像语义分割方法在无人机视觉图像语义分割任务中的可行性，并探讨其应用于该领域的优势和不足为目标，对ICNet、ESPNet、DFANet三种轻量级图像语义分割方法进行了详细研究，分析了它们的架构差异及各自的优缺点。接着，本文将所选的轻量级图像语义分割网络应用于无人机视觉图像语义分割任务，并设计了相应的实验，验证算法的有效性。最后，本文通过对实验结果解读及分割效果可视化，深入分析了现有轻量级图像语义分割算法在无人机视觉图像语义分割任务中的优势和不足，为后续工作提供了理论依据和针对性的改进方向。 (2)为解决前文提到的问题并深入分析无人机视觉图像的特点，本文提出了一种低空无人机实时图像语义分割方法。该方法采用了一种高效的超网络体系结构，通过在编码器的最后一层引入上下文头权重生成模块，即时生成解码器中每个块的权重，实现实时语义分割。在解码器采用局部连接层机制设计了一种动态分片卷积算法，充分考虑上下文的语义信息，针对不同物体进行有针对性的分割，提高网络的自适应性。针对无人机视觉图像语义分割数据集数据量较小的问题，采用迁移学习的方法将本文提出的网络在具有相似图像特征的数据集上进行预训练，使网络获得更好的训练表现和更多的高级特征信息。对本文模型进行参数调优和消融实验，并进行模型对比量化评估。本文提出的模型显示出了出色的结果，对于各个类别的平均交并比达到了66.3％,预测速度达到了37.9帧/秒，在保证实时性的条件下显著提升了分割精度，体现了本文算法的优越性和适用性。本文算法通过实验已被证明能够准确、高效的完成无人机视觉图像语义分割任务,具有较高的研究意义和实用价值。

关键词

无人机/语义分割/局部连接层/深度学习/视觉图像

引用本文复制引用

授予学位

硕士

学科专业

计算机技术

导师

白俊卿

学位年度

2023

学位授予单位

西安石油大学

语种

中文

中图分类号

段落导航