首页|期刊导航|计算机工程|学习驱动的图像压缩算法研究

学习驱动的图像压缩算法研究OA北大核心

中文摘要

目前,基于卷积神经网络(CNN)深度学习的图像压缩已经取得了优异的成果,但是CNN的感受野通常受限,不能学习到图像非局部区域内像素之间的上下文关系,缺少了长距离建模和感知能力,容易造成结果失真、伪影和压缩率较高等问题。针对以上问题,提出2种解决办法:设计一种由CNN、多尺度注意力(MSA)机制和残差单元构成的对称编解码器架构,该架构在对图片进行通道变换和空间变换的同时引入多尺度注意力机制,能够对特征进行重新校准,减少潜在表示的冗余像素;设计一种基于U型框架的超先验网络,可以在不同层级上获取多尺度的上下文信息,在帮助提取高级语义特征的同时,保留详细的低级特征信息,能够更好地进行边界细化和细节恢复。在Kodak、Tecnick和CLIC这3种数据集上将所提方法与其他先进的图像压缩方法进行对比实验,结果表明,在相同比特率下,该方法相较对比方法在峰值信噪比(PSNR)指标上分别提高了约0.3 dB、0.6 dB、0.5 dB。所提方法在保证压缩率的同时,能够有效提高对非重复纹理特征和图像细节特征的重建效果。

杨红菊;吉昌

山西大学计算机与信息技术学院,山西太原030006 山西大学计算智能与中文信息处理教育部重点实验室,山西太原030006山西大学计算机与信息技术学院,山西太原030006

计算机与自动化

深度学习图像压缩多尺度注意力机制超先验网络Transformer

《计算机工程》 2025 (1)

P.190-197,8

国家自然科学基金(62376154)山西省自然科学基金(202303021211024)研究生教育创新计划精品教学案例项目(2023AL04)。

10.19678/j.issn.1000-3428.0068782

评论