摘要
该文比较了人和计算机认字机理的差异,通过人识别汉字的心理学实验,验证了人识别汉字的主要依据是汉字的轮廓,也即汉字四边上的信息,个别笔划的脱落或畸变有时不影响字形的辨认。从而提出了一种按汉字四侧笔划尖端数进行粗分类方法,并发展了一种用于汉字粗分类的二叉查找树。按这种方法,将汉字四边的笔划数编成码,同码的字分到一组,每一组汉字对应着二叉查找树的一个结点。并利用汉字的使用频度,对二叉查找树进行了优化,使得查找效率为最高。最后,给出了分类实验,并进行了逐个识别实验。实验结果表明,这种方法是有效的,而且识别速度较快,适宜在微型机上实现印刷体汉字识别系统。(本刊录)