中文信息学报2017,Vol.31Issue(5) :64-73.

基于部件组合的联机手写"藏文—梵文"样本生成

Online Handwritten Sample Generated Based on Component Combination for Tibetan-Sanskrit

王维兰 卢小宝 蔡正琦 沈文韬 付吉 才科扎西
中文信息学报2017,Vol.31Issue(5) :64-73.

基于部件组合的联机手写"藏文—梵文"样本生成

Online Handwritten Sample Generated Based on Component Combination for Tibetan-Sanskrit

王维兰 1卢小宝 2蔡正琦 1沈文韬 1付吉 1才科扎西1
扫码查看

作者信息

  • 1. 西北民族大学数学与计算机科学学院,甘肃兰州730030
  • 2. 中国人民银行白银中心支行,甘肃白银730900
  • 折叠

摘要

"藏文—梵文"包括500多个现代藏文、6000多个梵音藏文,在文字识别领域属于大类别的字符集,所以联机手写样本采集是庞大而复杂的工程.鉴于此,提供了一种基于部件组合的"藏文—梵文"手写样本生成方法,主要包括:(1)确定"藏文—梵文"字符集和部件集;(2)获取"藏文—梵文"字丁的部件位置信息;(3)采集联机手写"藏文—梵文"部件的样本;(4)生成联机手写"藏文—梵文"字符集样本库.该文为联机手写"藏文—梵文"识别的研究提供字符训练样本库和测试样本库,提高了手写梵音藏文样本采集效率,解决了样本数量及多样性问题,降低了样本采集成本,为进一步联机手写梵音藏文识别的研究与系统开发奠定了基础.

Abstract

Tibetan-Sanskrit includes more than 500 Tibetan characters,and more than 6000 Sanskrit.Belonging to the large class of character set,the sample collection of the online handwritten is a large and complex project.We present an online handwriting character sample generation method based on component combination for Tibetan-San-skrit.The proposed method includes four main parts :(1) to determine the Tibetan-Sanskrit character set and com-ponent set ;(2) to get location information of Tibetan-Sanskrit characters ;(3) to collect online handwritten sample of component set for Tibetan-Sanskrit ;and (4) to generate sample database of online handwritten Tibetan-Sanskrit character set.This provides the character's training sample set and test sample set for online handwritten Tibetan-Sanskrit.

关键词

联机手写/藏文—梵文/字符集/部件组合/样本生成

Key words

online handwritten/Tibetan-Sanskrit/character set/component combination/sample generation

引用本文复制引用

基金项目

国家自然科学基金(61375029)

国家民委领军人才计划()

西北民族大学中央高校基本科研业务费专项资金(31920170142)

出版年

2017
中文信息学报
中国中文信息学会,中国科学院软件研究所

中文信息学报

CSTPCDCSCDCHSSCD北大核心
影响因子:0.8
ISSN:1003-0077
被引量2
参考文献量5
段落导航相关论文