A Disney Research recentemente divulgou uma inovadora técnica de compressão de imagens que gera imagens mais realistas mantendo uma taxa de transferência de dados baixa.
Embora esta nova técnica de codec seja mais complexa do que os codecs tradicionais como JPEG e AV1, ela apresenta vantagens significativas em termos de qualidade de imagem e eficiência de processamento. A equipe de pesquisa descobriu que, combinando o erro de quantização com o processamento de ruído na manipulação de imagens, é possível reconstruir melhor os detalhes da imagem na taxa de bits desejada.
Comparação do método de compressão da Disney com métodos anteriores. Os autores afirmam que a recuperação de detalhes foi melhorada, oferecendo um modelo que não requer treinamento de centenas de milhares de dólares e que é mais rápido que o método concorrente mais próximo.
Os pesquisadores afirmam que a nova técnica requer menos de 10% do processo de processamento completo e não exige alterações significativas na arquitetura do sistema. Em testes práticos, a qualidade da imagem reconstruída pela técnica foi mais bem avaliada pelos usuários finais, mesmo que outros métodos de compressão usassem o dobro da taxa de bits.
No entanto, a técnica também apresenta algumas limitações. Em alguns casos específicos, a imagem reconstruída pode apresentar pequenas imprecisões, como linhas ligeiramente curvas ou bordas de objetos pequenos levemente distorcidas. Esses problemas são principalmente devido às limitações da dimensionalidade das características do sistema.
Nos testes de aplicação prática, a equipe de pesquisa utilizou vários conjuntos de dados para avaliação, incluindo Kodak, CLIC2022 e COCO30k. Os indicadores de avaliação incluíram vários aspectos, como a relação sinal-ruído de pico (PSNR), o índice de similaridade perceptiva aprendida (LPIPS), o índice de similaridade estrutural multi-escala (MS-SSIM) e a distância inicial de Fréchet (FID).
Comparação adicional do novo método da Disney (destacado em verde) com outros métodos.
O estudo com usuários utilizou um método de escolha forçada, avaliado por meio de um sistema de classificação Elo semelhante ao do xadrez. Os resultados mostraram que a nova técnica da Disney obteve pontuações significativamente mais altas dos usuários, mesmo quando os concorrentes utilizavam o dobro da quantidade de dados.
Em termos de velocidade de processamento, a nova técnica apresentou uma melhoria significativa em comparação com os principais concorrentes, reduzindo o tempo de processamento de 6,87 segundos para 3,49 segundos. Essa melhoria na eficiência, juntamente com o excelente desempenho de compressão, confere à técnica um importante valor de aplicação nas áreas de armazenamento e transmissão de imagens.
É importante notar que o desenvolvimento de técnicas de compressão de imagens é fundamental para resolver problemas globais relacionados ao armazenamento de dados, transmissão de streaming e consumo de energia. Embora a melhor solução técnica nem sempre seja a mais amplamente adotada no mercado, a inovação da Disney oferece ao setor uma solução que equilibra eficiência e desempenho.