一种基于印刷体汉字四边笔划尖端特征的汉字识别方法

史瑞琦¹

扫码查看

作者信息

1. 南开大学
折叠

摘要

该文比较了人和计算机认字机理的差异，通过人识别汉字的心理学实验，验证了人识别汉字的主要依据是汉字的轮廓，也即汉字四边上的信息，个别笔划的脱落或畸变有时不影响字形的辨认。从而提出了一种按汉字四侧笔划尖端数进行粗分类方法，并发展了一种用于汉字粗分类的二叉查找树。按这种方法，将汉字四边的笔划数编成码，同码的字分到一组，每一组汉字对应着二叉查找树的一个结点。并利用汉字的使用频度，对二叉查找树进行了优化，使得查找效率为最高。最后，给出了分类实验，并进行了逐个识别实验。实验结果表明，这种方法是有效的，而且识别速度较快，适宜在微型机上实现印刷体汉字识别系统。（本刊录）

关键词

汉字识别/字形/信息处理

引用本文复制引用

主办单位

中国计算机学会

会议名称

全国青年计算机工作者学术交流会

会议时间

1987-08-11

会议地点

哈尔滨

会议母体文献

全国青年计算机工作者学术交流会论文集

页码

F202-205

出版时间

1987

段落导航