基于深度学习的联机手写蒙古文词语识别方法研究

刘吉¹

扫码查看

作者信息

1. 中国科学院大学
折叠

摘要

近年来随着如智能手机、平板电脑等智能终端、可移动设备的普及，手写识别的应用场景越来越广泛，联机手写识别的研究越来越来重要。国外联机手写识别的研究起步很早，英文联机手写识别也取得相当不错的成果。国内联机手写识别的起步相对较晚，但是在广大科技工作者的辛勤奋斗下，相关研究也取得令人瞩目的成果，汉字联机手写识别的精度在公开数据集上能达到97％以上的精度，许多汉字联机手写的应用也如雨后春笋般冒出来。然而蒙古文手写识别的研究和进展却仍难让人满意，主要是因为相关的研究人员人数不多（主要是内蒙古大学和少数研究机构在作相关的工作）和蒙古文字自身的一些特性。近年来深度学习算法在机器学习、模式识别领域掀起了一番研究的热潮，它以端到端方式及高精度识别等特点吸引着越来越多研究者的注意。应用深度学习的方法之后，联机手写识别的效果也取得喜人的进展。本文将基于无切分方式和深度学习的方法提出两种实现联机手写蒙古文词语识别的方法。本文的主要研究工作和贡献包括: 1、基于整词识别的方法和卷积神经网络（CNN）设计了一个10层（不包含输入层在内）的卷积神经网络模型MWRCNN作为实现联机手写蒙古文词语识别的基线系统，其在联机手写蒙古文词语数据集上的识别精度为91.20％。基于传统滑动窗口方法的序列识别方法和循环神经网络（RNN）设计了一个5层的深度双向长短记忆(DBLSTM)循环神经网络作为实现联机手写蒙古文词语识别的基线系统，在数据集上的识别精度为88.45％。 2、在卷积神经网络模型基线系统的基础上，设计了一种新颖的位置特征图(Position-map)和不同宽高比的图像变换方法，提出两种特征融合的方法将数据变换方法生成的图像用MWRCNN提取特征进行融合和基于模型融合方法将数据变换方法生成的多种图像数据训练相应的模型进行融合，最终基于整词的识别方法将蒙古文词语的识别精度从91.20％提高到93.24％。 3、针对传统滑动窗口方法存在的生成序列数据少和序列信息单一的缺点，提出了一种新颖的非等间隔滑动窗口方法，其滑动步长不等且能生成更多数量的序列数据。将该方法应用于循环神经网络模型基线系统中，提高了识别的精度，同时基于该方法和循环神经网络模型设计模型融合方法，最终基于序列的识别方法将蒙古文词语的识别精度从88.45％提高到90.35％。

关键词

联机手写识别/蒙古文/无切分方式/深度学习/非等间隔滑动窗口

引用本文复制引用

授予学位

硕士

学科专业

软件工程

导师

马龙龙

学位年度

2017

学位授予单位

中国科学院大学

语种

中文

中图分类号

段落导航