基于深度学习的水下图像增强算法研究

石慧¹

扫码查看

作者信息

1. 吉林大学
折叠

摘要

在水下环境中，悬浮的颗粒会对光造成散射和波长相关的衰减，使水下图像出现颜色失真、成像模糊以及对比度低等问题，影响对水下图像中有用信息的获取，不利于后续图像目标检测、图像分割等高级视觉任务的进行。针对上述问题，国内外研究人员提出了多种水下图像增强算法，但现有算法具有一定的局限性。传统的水下图像增强方法对失真严重的水下图像的增强效果较差，增强后的图像会引入噪声或者出现过度增强，无法获得理想的增强结果，而当前基于深度学习的方法因为缺少成对数据集，多利用对抗生成网络在生成合成数据集的同时实现水下图像增强，而实验表明合成数据集与真实数据集仍存在差异，使得现有方法在真实水下环境中应用效果不佳，而非基于对抗生成网络的算法无法提供能够处理水下图像多样性的单一解决方案，算法鲁棒性较差。本文在现有算法的基础上进一步探索了深度学习在水下图像增强领域的应用，提出2种基于深度学习的水下图像增强方法，分别为基于双重残差混合注意力机制的水下图像增强算法和基于残差Swin Transformer的水下图像增强算法。其中基于双重残差混合注意力机制的水下图像增强算法致力于以较小的模型参数量获得优秀的性能，该算法采用改进的双重残差块完成特征学习，并通过在双重残差块中引入混合注意力模块，沿通道和空间两个维度对特征进行注意力权重推断，以捕获显著特征；基于残差Swin Transformer的水下图像增强算法探索了深度学习模型Swin Transformer在水下图像增强任务中的应用，并致力于实现模型性能与模型规模之间的平衡，获得了最优的性能，该算法通过建立层次化结构充分发挥了传统卷积神经网络和Transformer的优点，并通过残差连接实现了多尺度特征的融合。为激励产生颜色自然、对比度高且具有更精细纹理的增强图像，本文设计了结合????1损失、结构相似性损失和内容感知损失的联合特征损失函数，对网络进行端到端训练。此外，本文应用水下图像形成模型（Image Formation Model，IFM）对水下图像基准数据集（Underwater Image Enhancement Benchmark dataset，UIEB）进行优化，获得了具有更高视觉质量的N-UIEB数据集，实验表明，相较于UIEB数据集，基于N-UIEB训练得到的增强图像具有更自然的颜色和更清晰的细节。本文将提出的方法基于双重残差混合注意力机制的水下图像增强算法和基于残差Swin Transformer的水下图像增强算法获得的增强结果与主流的方法进行比较和分析，结果表明，本文提出的方法有效提高了图像对比度并恢复了图像颜色，且在细节恢复方面表现优秀，而且在与水下图像增强算法的定量比较中获得了优秀的性能。

关键词

水下图像增强/图像处理/计算机视觉/深度学习/机器学习

引用本文复制引用

授予学位

硕士

学科专业

计算机应用技术

导师

王欣

学位年度

2022

学位授予单位

吉林大学

语种

中文

中图分类号

段落导航