Les chercheurs de Disney ont récemment publié une nouvelle technique de compression d'images innovante qui produit des images plus réalistes tout en maintenant un faible débit de données.

Bien que cette nouvelle technique de codage-décodage soit plus complexe que les codecs traditionnels tels que JPEG et AV1, elle présente des avantages significatifs en termes de qualité d'image et d'efficacité de traitement. L'équipe de recherche a constaté qu'en combinant l'erreur de quantification avec le traitement du bruit dans le traitement d'image, il est possible de mieux reconstruire les détails de l'image au débit binaire cible.

QQ20241031-143415.png

Comparaison de la méthode de compression Disney avec les méthodes précédentes. Les auteurs affirment que la restauration des détails est améliorée, tout en proposant un modèle qui ne nécessite pas des centaines de milliers de dollars d'entraînement et qui est plus rapide que la méthode concurrente la plus proche.

Selon les chercheurs, la nouvelle technique ne nécessite que moins de 10 % du processus de traitement complet et ne nécessite aucune modification majeure de l'architecture du système. Lors de tests réels, même lorsque d'autres méthodes de compression utilisaient un débit binaire deux fois plus élevé, la qualité de l'image reconstruite par cette technique était mieux appréciée par les utilisateurs finaux.

Cependant, cette technique présente certaines limitations. Dans certains cas spécifiques, l'image reconstruite peut présenter de légères inexactitudes, telles que de légères courbures de lignes droites ou de légères distorsions des bords de petits objets. Ces problèmes sont principalement dus aux limitations de la dimensionnalité des caractéristiques du système.

Lors des tests d'application réels, l'équipe de recherche a utilisé plusieurs ensembles de données pour l'évaluation, notamment Kodak, CLIC2022 et COCO30k. Les indicateurs d'évaluation comprenaient plusieurs dimensions, telles que le rapport signal sur bruit de crête (PSNR), l'indice de similarité perceptuelle d'apprentissage (LPIPS), l'indice de similarité structurelle multi-échelle (MS-SSIM) et la distance initiale de Fréchet (FID).

QQ20241031-143422.png

Comparaison plus approfondie de la nouvelle méthode Disney (surlignée en vert) avec d'autres méthodes.

L'étude utilisateur a utilisé une méthode de choix forcé, évaluée à l'aide d'un système de classement Elo similaire à celui des championnats d'échecs. Les résultats montrent que la nouvelle technique de Disney a obtenu un score utilisateur nettement plus élevé, même lorsque les concurrents utilisaient deux fois plus de données.

En termes de vitesse de traitement, la nouvelle technique présente une amélioration significative par rapport aux principaux concurrents, le temps de traitement passant de 6,87 secondes à 3,49 secondes. Cette amélioration de l'efficacité, combinée à d'excellents résultats de compression, confère à cette technique une valeur applicative importante dans les domaines du stockage et du transfert d'images.

Il est important de noter que le développement de techniques de compression d'images revêt une importance considérable pour résoudre les problèmes mondiaux liés au stockage de données, à la diffusion en continu et à la consommation d'énergie. Bien que la meilleure solution technique ne soit pas toujours celle qui obtient la plus large reconnaissance sur le marché, l'innovation de Disney offre au secteur une solution qui établit un bon équilibre entre efficacité et performance.