计算机技术与发展2023,Vol.33Issue(10) :163-168,208.DOI:10.3969/j.issn.1673-629X.2023.10.025

基于注意力机制藏文乌金体古籍文字识别研究

Research on Tibetan Ujin Ancient Book Character Recognition Based on Attention Mechanism

童攀 龙炳鑫 拥措
计算机技术与发展2023,Vol.33Issue(10) :163-168,208.DOI:10.3969/j.issn.1673-629X.2023.10.025

基于注意力机制藏文乌金体古籍文字识别研究

Research on Tibetan Ujin Ancient Book Character Recognition Based on Attention Mechanism

童攀 1龙炳鑫 1拥措1
扫码查看

作者信息

  • 1. 西藏大学 信息科学技术学院,西藏 拉萨 850000;西藏大学 藏文信息技术人工智能西藏自治区重点实验室,西藏 拉萨 850000;西藏大学 藏文信息技术教育部工程研究中心,西藏 拉萨 850000
  • 折叠

摘要

藏文乌金体古籍文字识别是古籍文字识别领域的一个难题.针对藏文乌金体古籍中存在的文字粘连和背景复杂问题,提出一种基于注意力机制的藏文乌金体古籍文字识别方法.该方法主要包含两部分,编码器部分采用卷积神经网络(CNN)与双向长短期记忆(Bi-LSTM)获得图像文本的特征序列和序列标注,解码器部分使用注意力机制计算注意力权重并与循环神经网络(RNN)相结合得出识别结果.采用实验室的616 张藏文乌金体古籍作为实验数据集以及藏文字丁准确率作为实验评测指标.采用两种文字识别模型作为基线模型,从模型大小和识别率进行对比,文中识别模型在模型大小和识别效果上都优于其他两个模型,文中模型大小41.2 MB,相比基线模型中最小的优化了36 MB,字丁识别准确率90.55%,相比基线模型中最好的结果提高了7.94 百分点.表明所提出的基于注意力机制的藏文乌金体古籍识别模型,显著提高了藏文乌金体古籍中的粘连文字和背景复杂图像的识别效果.

关键词

藏文古籍/文字识别/乌金体/注意力机制/字丁准确率

Key words

ancient books in Tibetan/text recognition/the sharply body/mechanism of attention/accuracy of character

引用本文复制引用

基金项目

国家重点研发计划重点专项(2017YFB1402202)

西藏自治区科技创新基地自主研发项目(XZ2021HR002G)

出版年

2023
计算机技术与发展
陕西省计算机学会

计算机技术与发展

CSTPCD
影响因子:0.621
ISSN:1673-629X
参考文献量3
段落导航相关论文