计算机技术与发展2020,Vol.30Issue(5) :201-205,210.

关于常用字覆盖率统计算法的研究

Research on Statistical Algorithms of Coverage Rate of Commonly Used Chinese Characters

阿不都克里木·玉素甫 杨琴 王亮亮
计算机技术与发展2020,Vol.30Issue(5) :201-205,210.

关于常用字覆盖率统计算法的研究

Research on Statistical Algorithms of Coverage Rate of Commonly Used Chinese Characters

阿不都克里木·玉素甫 1杨琴 2王亮亮3
扫码查看

作者信息

  • 1. 新疆教育学院 现代教育技术中心,新疆 乌鲁木齐 830043;新疆教育云技术与资源实验室,新疆 乌鲁木齐 830043
  • 2. 新疆教育云技术与资源实验室,新疆 乌鲁木齐 830043;新疆教育学院 信息科学与技术学院,新疆 乌鲁木齐 830043
  • 3. 新疆教育学院 现代教育技术中心,新疆 乌鲁木齐 830043
  • 折叠

摘要

对常用字在教育资源电子文本中的覆盖率、使用率、字频统计算法进行了研究,并根据算法通过计算机语言开发常用字覆盖率统计分析系统.统计分析系统可以对文本中所使用的常用字进行统计分析,即可以统计常用字覆盖率、文本汉字数、常用字字频、常用字使用率等,并根据统计数据以饼形图的方式显示.为了了解常用字在文本中的覆盖率和使用情况,通过常用字覆盖率统计分析系统对一些电子文本进行了统计分析,并得出相应的结果.结果表明常用字在文本中的覆盖率和使用率相当高,即581个常用字在文本中的覆盖率平均在68.9%以上,1000个常用字在文本中的覆盖率平均在81.4%以上,2500个常用字在文本中的覆盖率平均在96%以上,并且常用字在不同统计对象文本中的使用频度也会有所不同.

关键词

常用字/统计算法/覆盖率统计/使用率统计/字频统计

引用本文复制引用

基金项目

新疆维吾尔自治区重点实验室开放课题(2019D04024)

出版年

2020
计算机技术与发展
陕西省计算机学会

计算机技术与发展

CSTPCD
影响因子:0.621
ISSN:1673-629X
参考文献量5
段落导航相关论文