Recientemente, el departamento de investigación de Disney publicó una innovadora técnica de compresión de imágenes que genera imágenes más realistas manteniendo una baja tasa de transmisión de datos.
Esta nueva técnica de codificación-decodificación, aunque más compleja que los codificadores-decodificadores tradicionales como JPEG y AV1, muestra ventajas significativas en cuanto a calidad de imagen y eficiencia de procesamiento. El equipo de investigación descubrió que al combinar el error de cuantificación con el procesamiento de ruido en el procesamiento de imágenes, se pueden reconstruir mejor los detalles de la imagen a una tasa de bits objetivo.
Comparación del método de compresión de Disney con métodos anteriores. Los autores afirman que se ha mejorado la recuperación de detalles, al tiempo que se proporciona un modelo que no requiere un entrenamiento de cientos de miles de dólares y que funciona más rápido que el método competitivo equivalente más cercano.
Los investigadores indican que la nueva técnica solo requiere menos del 10% del proceso de procesamiento completo y no necesita modificaciones importantes en la arquitectura del sistema. En las pruebas prácticas, la calidad de la imagen reconstruida por esta técnica fue más apreciada por los usuarios finales, incluso cuando otros métodos de compresión utilizaron el doble de tasa de bits.
Sin embargo, esta técnica también presenta algunas limitaciones. En ciertas situaciones específicas, la imagen reconstruida puede mostrar pequeñas imprecisiones, como líneas ligeramente curvas o bordes de objetos pequeños ligeramente distorsionados. Estos problemas se deben principalmente a las limitaciones de la dimensionalidad de las características del sistema.
En las pruebas de aplicación práctica, el equipo de investigación utilizó varios conjuntos de datos para la evaluación, incluyendo Kodak, CLIC2022 y COCO30k. Los indicadores de evaluación abarcaron múltiples dimensiones, como la relación señal-ruido de pico (PSNR), el índice de similitud perceptiva de aprendizaje (LPIPS), el índice de similitud estructural multi-escala (MS-SSIM) y la distancia inicial de Fréchet (FID).
Comparación adicional del nuevo método de Disney (resaltado en verde) con otros métodos.
El estudio de usuarios empleó un método de selección forzada, evaluado mediante un sistema de clasificación Elo similar al del ajedrez. Los resultados mostraron que la nueva tecnología de Disney obtuvo puntuaciones de usuario significativamente más altas, incluso cuando los competidores utilizaron el doble de datos.
En cuanto a la velocidad de procesamiento, la nueva tecnología presenta una mejora significativa con respecto a sus principales competidores, reduciendo el tiempo de procesamiento de 6,87 segundos a 3,49 segundos. Esta mejora en la eficiencia, junto con su excelente efecto de compresión, hace que esta tecnología tenga un importante valor de aplicación en el campo del almacenamiento y transmisión de imágenes.
Cabe destacar que el desarrollo de técnicas de compresión de imágenes es de gran importancia para resolver problemas globales como el almacenamiento de datos, la transmisión de streaming y el consumo de energía. Aunque la mejor solución técnica no siempre es la más ampliamente aceptada en el mercado, la innovación de Disney ofrece al sector una solución que logra un buen equilibrio entre eficiencia y rendimiento.