首页|基于深度CNN的海洋生物目标检测算法研究

基于深度CNN的海洋生物目标检测算法研究

张健

基于深度CNN的海洋生物目标检测算法研究

张健1
扫码查看

作者信息

  • 1. 桂林电子科技大学
  • 折叠

摘要

海洋生物具有丰富的营养价值,人类对其需求在不断增加,由于人生理特征的限制,使用水下机器人代替人类进行捕捞。水下机器人主要先使用目标检测算法来确定周围海洋生物的种类以及它的位置,然后对其进行捕捞。如果算法的性能表现不佳,就会间接导致捕捞效率低。由于水下环境的特殊性,海洋生物的图像质量较差,并且大多数表现为小目标,现有一些经典的目标检测网络对常见的较大目标检测的效果较好,对小目标检测效果较差,因此不能直接用来检测海洋生物。针对以上问题,以检测海参、海胆、扇贝和海星为例,论文采用图像增强并提出基于改进FasterR-CNN的海洋生物目标检测算法。论文主要的研究工作如下: (1)将水下机器人比赛数据集作为初始数据集,通过垂直翻转与Labelimg软件标注对其进行扩展,按照训练集、验证集和测试集三类划分。针对海洋生物图像质量差的问题,使用暗通道先验(DarkChannelPrior,DCP)、带色彩恢复的多尺度视网膜(MultiScaleRetinexwithColorRestoration,MSRCR)以及两者结合的DC-MSRCR算法增强图像,使用标签增强解决部分图像显现出新目标的问题。 (2)介绍卷积神经网络、SSD、YOLO-v3以及FasterR-CNN相关理论,并基于FasterR-CNN对图像增强算法与标签增强方法能否提升目标检测的精度进行实验。实验结果表明,图像增强前后的检测精度提升4.7%,标签增强后在此基础上提升2.1%,证明图像增强与标签增强能提升目标检测的精度。其中MSRCR增强算法的检测精度优于DCP、DC-MSRCR增强算法,因此后续采用MSRCR增强后的图像进行实验。 (3)针对海洋生物大多数为小目标,部分为较大目标的特点,提出基于改进FasterR-CNN的海洋生物目标检测算法。由于ResNet50中浅层特征图的特征语义信息较低,不能用于检测小目标,需要增强其特征语义信息,另外数据集中还存在部分较大目标,因此算法采用了多尺度注意力特征金字塔网络(MultiScaleAttentionFeaturePyramidNetwork,MSAFPN)。MSAFPN对ResNet50的前三个特征图进行上采样与下采样操作来提取更多特征,并使用通道注意力和空间注意力获得目标更精细的特征与位置信息。RoIPool对坐标位置的计算结果采取两次量化取整,量化取整引起的计算误差导致不能映射到原图对应像素点,影响小目标的检测。因此算法将RoIPool替换为RoIAlign,RoIAlign不进行量化取整操作,保留浮点数,从而避免计算误差的出现。通过多个对比实验,表明本文算法的检测精度相比于原始FasterR-CNN提升了16.9%,证明了该算法的有效性。

关键词

海洋生物/图像增强/改进FasterR-CNN

引用本文复制引用

授予学位

硕士

学科专业

电子信息

导师

陈小毛

学位年度

2023

学位授予单位

桂林电子科技大学

语种

中文

中图分类号

TP
段落导航相关论文