摘要
基于超先验自动编码器的潜在表示最近被应用于端到端图像压缩,其性能与最新的通用视频编码(VVC)帧内编码相当.图像压缩的率失真效率很大程度上受到自动编码器提取的潜在表示的影响.为此提出了一种新的注意力机制模块,利用长短注意力(LSA)模块进行深度学习图像压缩,将长短注意力模块引入自动编码器中,分别在编码阶段和解码阶段添加两个长短注意力模块来提高网络的编解码能力,从而使模型获得更准确的图像的潜在特征表示.长短注意力模块提高了自动编码器提取全局和局部图像特征的能力,节省比特率并实现更高的算法压缩性能.在JPEG-AI数据集上的实验表明,长短注意力模块成功地重建了图像细节,所提出的方法在多尺度结构相似性(MS-SSIM)方面实现了最先进的性能,并在低比特率下的峰值信噪比(PSNR)方面优于当前最先进的方法.