光电子·激光2023,Vol.34Issue(2) :166-173.DOI:10.16136/j.joel.2023.02.0146

基于注意力机制的多方向文本检测

Multi-directional text detection based on attention mechanism

徐健 郭湛澎 刘秀平 陈博 闫焕营
光电子·激光2023,Vol.34Issue(2) :166-173.DOI:10.16136/j.joel.2023.02.0146

基于注意力机制的多方向文本检测

Multi-directional text detection based on attention mechanism

徐健 1郭湛澎 1刘秀平 1陈博 1闫焕营2
扫码查看

作者信息

  • 1. 西安工程大学电子信息学院,陕西西安710048
  • 2. 深圳罗博泰尔机器人技术有限公司,广东深圳518109
  • 折叠

摘要

针对多方向排列的文本因其尺度变化大、复杂背景干扰而导致检测效果仍不甚理想的问题,本文提出了一种基于注意力机制的多方向文本检测方法.首先,考虑到自然场景下干扰信息多,构建文本特征提取网络(text feature information ResNet50,TF-ResNet),对图像中的文本特征信息进行提取;其次,在特征融合模型中加入文本注意模块(text attention module,TAM),抑制无关信息的同时突出显示文本信息,以增强文本特征之间的潜在联系;最后,采用渐进扩展模块,逐步融合扩展前部分得到的多个不同尺度的分割结果,以获得精确检测结果.本文方法在数据集CTW1500、ICDAR2015上进行实验验证和分析,其F值分别达到80.4%和83.0%,比次优方法分别提升了 2.0%和2.4%,表明该方法在多方向文本检测上与其他方法相比具备一定的竞争力.

关键词

场景文本检测/注意力机制/文本特征提取网络(TF-ResNet)/文本注意模块

引用本文复制引用

基金项目

陕西省科技厅项目(2018GY-173)

西安市科技局项目(GXYD7.5)

出版年

2023
光电子·激光
天津理工大学 中国光学学会

光电子·激光

CSCD北大核心
影响因子:1.437
ISSN:1005-0086
被引量2
参考文献量3
段落导航相关论文