光电子·激光2021,Vol.32Issue(7) :728-734.DOI:10.16136/j.joel.2021.07.0486

基于深度学习的场景文本检测算法研究

Research on scene text detection algorithm based on deep learning

熊炜 艾美慧 杨荻椿 李利荣 刘敏 王娟 曾春艳
光电子·激光2021,Vol.32Issue(7) :728-734.DOI:10.16136/j.joel.2021.07.0486

基于深度学习的场景文本检测算法研究

Research on scene text detection algorithm based on deep learning

熊炜 1艾美慧 2杨荻椿 2李利荣 2刘敏 2王娟 2曾春艳2
扫码查看

作者信息

  • 1. 湖北工业大学电气与电子工程学院,湖北武汉430068;美国南卡罗来纳大学计算机科学与工程系,南卡哥伦比亚29201
  • 2. 湖北工业大学电气与电子工程学院,湖北武汉430068
  • 折叠

摘要

针对自然场景中任意形状文本图像因文本行难以区分导致的信息丢失问题,提出了一种基于深度学习的场景文本检测算法.首先构建特征提取模块,使用Resnet50作为骨干网络,在增加跨层连接的金字塔网络结构中引入并联的空洞卷积模块,以提取更多语义信息;其次,对得到的特征图进行多尺度特征融合,学习不同尺度的特征;最后预测出不同内核大小的文本实例,并通过尺度扩展逐渐扩大文本行区域,直到得到最终的检测结果.实验结果表明,该方法在SCUT-CTW1500弯曲文本数据集上的准确率、召回率及F1值分别达到88.5%、77.0%和81.3%,相比其他基于分割的算法,该算法对弯曲文本的检测效果良好,具有一定的应用价值.

关键词

场景文本检测/深度学习/特征提取/多尺度特征融合/空洞空间金字塔

引用本文复制引用

基金项目

国家自然科学基金资助项目(61571182)

国家自然科学基金资助项目(61601177)

湖北省自然科学基金(2019CFB530)

湖北省科技厅重大专项(2019ZYYD020)

国家留学基金(201808420418)

出版年

2021
光电子·激光
天津理工大学 中国光学学会

光电子·激光

CSCD北大核心
影响因子:1.437
ISSN:1005-0086
被引量2
参考文献量1
段落导航相关论文