首页|基于注意力机制的多方向文本检测

基于注意力机制的多方向文本检测

扫码查看
针对多方向排列的文本因其尺度变化大、复杂背景干扰而导致检测效果仍不甚理想的问题,本文提出了一种基于注意力机制的多方向文本检测方法.首先,考虑到自然场景下干扰信息多,构建文本特征提取网络(text feature information ResNet50,TF-ResNet),对图像中的文本特征信息进行提取;其次,在特征融合模型中加入文本注意模块(text attention module,TAM),抑制无关信息的同时突出显示文本信息,以增强文本特征之间的潜在联系;最后,采用渐进扩展模块,逐步融合扩展前部分得到的多个不同尺度的分割结果,以获得精确检测结果.本文方法在数据集CTW1500、ICDAR2015上进行实验验证和分析,其F值分别达到80.4%和83.0%,比次优方法分别提升了 2.0%和2.4%,表明该方法在多方向文本检测上与其他方法相比具备一定的竞争力.
Multi-directional text detection based on attention mechanism

徐健、郭湛澎、刘秀平、陈博、闫焕营

展开 >

西安工程大学电子信息学院,陕西西安710048

深圳罗博泰尔机器人技术有限公司,广东深圳518109

场景文本检测 注意力机制 文本特征提取网络(TF-ResNet) 文本注意模块

陕西省科技厅项目西安市科技局项目

2018GY-173GXYD7.5

2023

光电子·激光
天津理工大学 中国光学学会

光电子·激光

CSCD北大核心
影响因子:1.437
ISSN:1005-0086
年,卷(期):2023.34(2)
  • 2
  • 3