计算机技术与发展2020,Vol.30Issue(11) :20-24,29.DOI:10.3969/j.issn.1673-629X.2020.11.004

一种轻量级的不规则场景文本识别模型

A Lightweight Model for Irregular Scene Text Recognition

产世兵 刘宁钟 沈家全
计算机技术与发展2020,Vol.30Issue(11) :20-24,29.DOI:10.3969/j.issn.1673-629X.2020.11.004

一种轻量级的不规则场景文本识别模型

A Lightweight Model for Irregular Scene Text Recognition

产世兵 1刘宁钟 1沈家全1
扫码查看

作者信息

  • 1. 南京航空航天大学 计算机科学与技术学院,江苏 南京 211106
  • 折叠

摘要

场景文本识别是近年来极具挑战性的任务,不同于规则的文档文本图像,场景图像中的文本具有形态多变和弯曲等特点,识别起来很有难度.该文提出了一种轻量级的场景文本识别模型(ISTR-LW),不同于现有的场景文本识别模型具有参数量大的缺点,该模型在特征序列提取中引入了经过改变后的轻量级网络PeleeNet,不仅大幅度减少了模型的参数量,还加快了网络预测的速度;在循环网络层中获取标签分布时,引入了Dense Block模块,加快了网络训练的收敛速度;在获取最终识别结果时,引入了注意力机制,获得需要关注的重点区域,提高了模型文本识别的准确度;引入了薄板样条插值转换,通过修正不规则的文本,改善了不规则的文本识别率低的问题.ISTR-LW模型是一个端到端的文本识别模型,在Synth90K、Street View Text和ICDAR等公开数据集上进行了实验,取得了不错的效果.

关键词

场景文本识别/卷积神经网络/轻量级网络/循环神经网络/空间变换网络

引用本文复制引用

基金项目

国家自然科学基金(61375021)

出版年

2020
计算机技术与发展
陕西省计算机学会

计算机技术与发展

CSTPCD
影响因子:0.621
ISSN:1673-629X
参考文献量4
段落导航相关论文