首页|基于深度学习网络的手写字符识别轻量化模型研究

基于深度学习网络的手写字符识别轻量化模型研究

张重飞

基于深度学习网络的手写字符识别轻量化模型研究

张重飞1
扫码查看

作者信息

  • 1. 中国民航大学
  • 折叠

摘要

随着信息技术的进步,采用数字文档替代手写纸质文档完成存储与记录,逐渐成为各行业领域首选。在民航机务维修领域,数字工单的生成需要通过对手写纸质工单的识别获取。出于在户外维修场景下以及维修信息的安全传输考虑,手写字符识别模型需要在硬件资源有限的移动端或嵌入式端中离线部署。此外,手写文字,特别是汉字,由于结构笔画复杂,书写因人而异,且存在大量的相似字符,导致识别效果不佳。因此在提高手写字符识别精度的同时实现模型的轻量化,具有重要的实际应用价值。 本文研究基于深度学习的手写字符识别方法,构建改进VGG16结构。主要创新之处在于: 第一,针对手写字符图像尺度较小且为单通道灰度图的特点,简化VGG16网络结构,减少模型计算量和参数量,提高模型的泛化性和收敛速度,并利用Ghost卷积替代标准卷积,进一步使模型轻量化。第二,引入置信学习方法去除数据集的噪声样本,解决了字符标签错误和书写错误造成的误识别,提高了模型训练和测试效果。第三,融合注意力机制和可变形卷积,重构网络特征提取模块,改善了相似字符局部特征差异和笔画形变导致的误识别,提高了类内、类间字符识别准确率。 实验表明,改进后模型大小32.3MB,对3755类汉字的识别准确率达到97.75%,加入英文、数字后的识别准确率达到97.63%。在仅汉字数据集中与经典的手写字符识别方法比较,如GoogLenet、ResNet、HEGL、CWCCNN-V1等,识别准确率分别提高了2.44%、2.68%、1.01%、0.19%,且实现了模型轻量化,相似字符识别效果得到改善,提高了识别的实时性和准确性。

关键词

手写字符识别/轻量化模型/可变形卷积/注意力机制/置信学习

引用本文复制引用

授予学位

硕士

学科专业

电子信息硕士

导师

郭晓静/戎雪辉

学位年度

2023

学位授予单位

中国民航大学

语种

中文

中图分类号

TP
段落导航相关论文