计算机科学2021,Vol.48Issue(12) :249-255.DOI:10.11896/jsjkx.200700072

基于多级文本检测的复杂文档图像扭曲矫正算法

Distortion Correction Algorithm for Complex Document Image Based on Multi-level Text Detection

寇喜超 张鸿锐 冯杰 郑雅羽
计算机科学2021,Vol.48Issue(12) :249-255.DOI:10.11896/jsjkx.200700072

基于多级文本检测的复杂文档图像扭曲矫正算法

Distortion Correction Algorithm for Complex Document Image Based on Multi-level Text Detection

寇喜超 1张鸿锐 1冯杰 2郑雅羽1
扫码查看

作者信息

  • 1. 浙江工业大学信息工程学院 杭州 310023
  • 2. 浙江理工大学信息学院 杭州 310018
  • 折叠

摘要

文档的扭曲矫正是进行文档OCR(Optical Character Recognition)的基础步骤,对提高OCR的准确率有重要作用.文档图像的扭曲矫正常常依赖于文本的提取,然而目前文档图像矫正算法大都无法对复杂文档中的文本进行准确定位和分析,导致其矫正效果不理想.针对此问题,提出了一种基于全卷积网络的文字检测框架,并使用合成文档对网络进行针对性训练,可实现对字符、词、文本行三级文本信息的准确获取,进而对文本进行自适应采样并利用三次函数对页面进行三维建模,将矫正问题转化为模型参数优化问题,达到矫正复杂文档图像的目的.使用合成扭曲文档以及真实测试数据进行矫正实验,结果表明,提出的矫正方法能够对复杂文档进行精确的文本提取,明显改善了复杂文档图像矫正后的视觉效果,相比于其他算法,该算法矫正后OCR的准确率得到显著提高.

关键词

卷积神经网络/文本检测/文档三维建模/文档图像矫正/光学字符识别

引用本文复制引用

基金项目

国家自然科学基金(61501402)

出版年

2021
计算机科学
重庆西南信息有限公司(原科技部西南信息中心)

计算机科学

CSTPCDCSCD北大核心
影响因子:0.944
ISSN:1002-137X
被引量3
参考文献量1
段落导航相关论文