基于长短注意力模块的深度学习图像压缩方法

扫码查看

原文链接

NETL
NSTL
万方数据

中文摘要：基于超先验自动编码器的潜在表示最近被应用于端到端图像压缩,其性能与最新的通用视频编码(VVC)帧内编码相当.图像压缩的率失真效率很大程度上受到自动编码器提取的潜在表示的影响.为此提出了一种新的注意力机制模块,利用长短注意力(LSA)模块进行深度学习图像压缩,将长短注意力模块引入自动编码器中,分别在编码阶段和解码阶段添加两个长短注意力模块来提高网络的编解码能力,从而使模型获得更准确的图像的潜在特征表示.长短注意力模块提高了自动编码器提取全局和局部图像特征的能力,节省比特率并实现更高的算法压缩性能.在JPEG-AI数据集上的实验表明,长短注意力模块成功地重建了图像细节,所提出的方法在多尺度结构相似性(MS-SSIM)方面实现了最先进的性能,并在低比特率下的峰值信噪比(PSNR)方面优于当前最先进的方法.

作者：

段增辉、胡益诚、张旭博

展开 >

作者单位：

航空工业计算机研究所陕西西安 710068

关键词：

深度学习图像压缩注意力机制区域选择信噪比率失真

出版年：

2024

DOI：

10.3969/j.issn.1672-9528.2024.04.024

信息技术与信息化

山东电子学会

信息技术与信息化

影响因子：0.29

ISSN：1672-9528

年,卷(期)：2024.(4)

参考文献量19