迪士尼研究部门近日发布了一项创新的图像压缩技术,该技术在保持较低数据传输率的同时,能够生成更为逼真的图像效果。
这项新型编解码技术虽然在复杂度上较传统的JPEG和AV1等编解码器有所提升,但在图像质量和处理效率方面都展现出显著优势。研究团队发现,通过将量化误差与图像处理中的噪声处理相结合,可以在目标比特率下更好地重建图像细节。
迪士尼压缩方法与之前方法的比较。作者声称细节恢复效果有所改善,同时提供了一种不需要数十万美元训练的模型,并且运行速度比最接近的等效竞争方法更快。
研究人员表示,新技术只需执行不到10%的完整处理流程,且无需对系统架构进行重大改动。在实际测试中,即使其他压缩方法使用两倍的比特率,该技术重建的图像质量仍更受最终用户欢迎。
然而,该技术也存在一些局限性。在某些特定情况下,重建的图像可能会出现细微的不准确,例如直线轻微弯曲或小物体边界略有扭曲。这些问题主要源于系统特征维度的限制。
在实际应用测试中,研究团队采用了多个数据集进行评估,包括Kodak、CLIC2022和COCO30k。评估指标涵盖了峰值信噪比(PSNR)、学习感知相似性指标(LPIPS)、多尺度结构相似性指数(MS-SSIM)和Fréchet初始距离(FID)等多个维度。
进一步比较迪士尼的新方法(以绿色突出显示)与其他方法的对比。
用户研究采用了强制选择方法,通过类似国际象棋锦标赛的Elo评级系统进行评估。结果显示,即便在竞争对手使用两倍数据量的情况下,迪士尼的新技术仍然获得了明显更高的用户评分。
在处理速度方面,新技术相比主要竞争对手提升显著,处理时间从6.87秒缩短至3.49秒。这一效率的提升,加上出色的压缩效果,使该技术在图像存储和传输领域具有重要的应用价值。
值得注意的是,图像压缩技术的发展对于解决全球数据存储、流媒体传输和能源消耗等问题具有重要意义。虽然最佳技术方案并不总能获得最广泛的市场认可,但迪士尼的这项创新为业界提供了一个在效率和性能之间取得良好平衡的解决方案。