基于上下文模型的超长哈夫曼码校正算法

Correction Algorithm for Ultra-long Huffman Codes Based on Context Model

张永兴 ¹吴睿振 ¹贾晓龙 ¹陈静静 ¹孙华锦¹

扫码查看

作者信息

1. 浪潮人工智能研究院有限公司,陕西西安 710077
折叠

摘要

常见的Gzip、Zlib数据压缩标准都采用Deflate协议压缩封装数据,Deflate协议中采用哈夫曼码编码源符号(Source symbols).哈夫曼编码算法通过构建哈夫曼树生成哈夫曼码,Deflate协议限定源符号的哈夫曼码的码长不能超过最大值.源符号的哈夫曼码长最大值等于哈夫曼树的高度,因此当哈夫曼树的高度超过限定值时,需要先把哈夫曼树进行"校正",随后再为每个符号分配.Gzip、Zlib软件参考代码中使用的基于二叉树搜索的"校正"算法,校正时需要遍历搜索哈夫曼树,寻找嫁接"节点".校正流程时间消耗非常大,而且硬件实现难度较大.该文探索一种基于上下文模型校正超长哈夫曼树的算法,与参考二叉树搜索算法相比:该算法可以快速校正超长哈夫曼树,将校正的时间消耗降至为0,而且对压缩效果几乎没有影响(压缩比平均下降率仅为0.372％).该算法也易于硬件化实现,可以实时校正超长哈夫曼码.

关键词

Deflate/哈夫曼编码/哈夫曼树/超长Huffman码/超长Huffman码校正

引用本文复制引用

出版年

2023

计算机技术与发展

陕西省计算机学会

计算机技术与发展

CSTPCD

影响因子：0.621

ISSN：1673-629X

参考文献量18

段落导航