计算机技术与发展2023,Vol.33Issue(1) :49-55.DOI:10.3969/j.issn.1673-629X.2023.01.008

基于残差网络及笔画宽度变换的场景文本检测

Scene Text Detection Based on Residual Network and Stroke Width Transform

方承志 倪梦媛 唐亮
计算机技术与发展2023,Vol.33Issue(1) :49-55.DOI:10.3969/j.issn.1673-629X.2023.01.008

基于残差网络及笔画宽度变换的场景文本检测

Scene Text Detection Based on Residual Network and Stroke Width Transform

方承志 1倪梦媛 1唐亮1
扫码查看

作者信息

  • 1. 南京邮电大学 电子与光学工程学院、微电子学院,江苏 南京 210023
  • 折叠

摘要

针对目前自然场景中长文本检测效果不佳的问题,提出了一种基于残差网络及笔画宽度变换的自然场景文本检测算法.在EAST算法的基础上进行了改进,引入了残差结构加深网络深度,扩大了感受野,避免了梯度消失的问题,提升了网络的学习能力;并在损失函数中加入了预测框与真实文本框的中心点间距离作为惩罚项,有效区分了不同重叠方式的检测框,进一步提高了检测精度.同时在非极大值抑制阶段后增加了SWT(Stroke Width Transform,笔画宽度变换)阶段,对预测文本框进行扩展,依据规则判定是否存在漏检字符,补全了缺失的长文本信息.在ICDAR2015和MSRA-TD500数据集上进行了测试,将EAST算法的F值分别提高了3.7百分点和4.9百分点.表明该算法可以有效提高检测的准确度,并改善长文本的检测效果.

关键词

文本检测/长文本/残差结构/损失函数/笔画宽度变换

引用本文复制引用

基金项目

国家自然科学基金面上项目(61977039)

出版年

2023
计算机技术与发展
陕西省计算机学会

计算机技术与发展

CSTPCD
影响因子:0.621
ISSN:1673-629X
被引量1
参考文献量3
段落导航相关论文