祝贺!实验室研究成果被人工智能领域顶级会议ICML2022录用

 近日,实验室博三学生颜泽宇同学的论文《Optimally Controllable Perceptual Lossy Compression》被机器学习和人工智能领域顶级会议International Conference on Machine Learning (ICML) 录用。

ICML是公认的机器学习和人工智能领域最具影响力的国际会议之一,是CCF-A类会议,Core Conference Ranking A*类会议,ICML 2022录用率为21.9%。

近几年,基于深度学习的图像有损压缩取得了较大进展,然而现有方法以启发式方法为主实现重建失真与感知质量之间的权衡,缺乏理论分析,“如何从理论上定量刻画重建失真与重建感知质量之间的关系”以及“如何实现灵活可控的失真-感知权衡”仍然是尚待深入探讨的问题。该研究基于无约束的失真-感知函数,证明了在Wasserstein-2和MSE度量下,最优失真-感知权衡的线性插值特性。在RGB图像上仅使用两个解码器即可实现可控的最优失真-感知权衡。

论文中所提出的框架仅使用两个解码器就实现了可控的失真-感知权衡,通过对两个解码器输出进行线性插值即可完成对解压图像视觉质量与像素失真之间的调控。相比于传统方法对每一个失真-感知的权衡参数都需要专门训练特定的编解码器,该框架大大简化了失真-感知平衡的调试过程,同时也使得解压图像的失真更加可控。

文中提出的框架在MNIST、SUNCG和KODAK数据集上均进行了实验,包含黑白手写数字、深度图像和RGB图像等多种模态的数据。

在MNIST数据集上,文中提出的框架在失真-感知的平衡调节上比传统方法(基于GAN调整失真损失和感知损失权重λ)更优。

在SUNCG数据集上,论文所提出的方法在解压深度图像可以得到更加锐利的边界,且恢复出的点云场景中,因压缩产生的噪声点云更少。

在RGB图像上,论文所提出的方法也得到了更高的PI分数,在失真-感知的权衡上也取得比直接调节λ更优的结果。