首页|复杂场景船舶图像中的船名检测与识别研究

复杂场景船舶图像中的船名检测与识别研究

姜俐伶

复杂场景船舶图像中的船名检测与识别研究

姜俐伶1
扫码查看

作者信息

  • 1. 大连海事大学
  • 折叠

摘要

船舶身份的准确识别对船舶进出港管理、违规船舶检测、水路交通安防等有着重要的应用价值。随着深度学习技术的不断发展,船名检测与识别问题取得了许多研究成果,其工作主要为借鉴文本检测与识别、车牌检测与识别等相关领域的经验,从清晰图像中检测与识别出船名。然而,复杂场景船舶图像中存在的低分辨率、模糊、倾斜等问题,严重损害了检测与识别任务的性能。因此直接将相关领域的模型应用于船名检测与识别问题,存在一定的局限性。为此,针对复杂场景,本文将船名检测与识别问题划分为两个子任务,船名检测与船名识别,分别进行研究。主要研究工作如下: (1)针对船名在船舶图像中占比小、背景复杂问题,提出了基于注意力优化模块的船名检测方法ARMSND。ARMSND模型总共由四部分组成:特征提取层、注意力优化模块、特征融合层和输出层。针对骨干网络提取的深层和浅层特征,分别设计两个注意力优化模块,提升对不同尺寸船名的检测效果。其中在注意力优化模块中引入注意力机制,采用动态卷积核进行不同通道间特征权重的计算,引导模型关注有益的特征通道信息,从而提升船名检测的效果。在特征融合层进一步融合特征,融合后的特征馈入输出层,输出针对每个像素的得分图和船名边界框。 (2)针对船名区域字符存在一定的模糊、文字方向不定的问题,提出了特征增强的船名识别方法FESNR。FESNR模型总共由四部分组成:卷积层、增强块、循环层以及转录层。其中,针对模糊问题,在增强块中引入双匹配滤波器,对船名字符管状区域进行特征增强;针对文字方向不定问题,将双匹配滤波器进行旋转,以滤波器组的形式对不同方向的字符管状区域进行特征增强,从而提高船名识别的效果。此外,在卷积层中,对第四层和第六层池化窗口的宽和高设置不同的步长和填充值,以此产生更长的特征图,生成更长的特征序列,使模型更适用于船名字符的识别。经卷积层提取后的特征序列被送入到循环层,在循环层中采用双向长短期记忆网络预测每个帧的标签分布,最终转录层将每帧的预测翻译成船名标签序列。 (3)针对船名检测子任务,在真实数据集上进行了相关实验,并调整不同的交并比阈值,采用多种评估标准,验证了ARMSND模型的有效性。针对船名识别子任务,在真实数据集、生成数据集和仿真数据集上分别进行了相关实验,与其他基线模型进行对比,验证了FESNR模型能更准确的识别船名。

关键词

船名检测/船名识别/卷积神经网络/复杂场景

引用本文复制引用

授予学位

硕士

学科专业

软件工程

导师

周新

学位年度

2023

学位授予单位

大连海事大学

语种

中文

中图分类号

TP
段落导航相关论文