A equipe de pesquisa da Snap Inc. lançou recentemente um gerador de imagens de IA chamado SnapGen, capaz de gerar imagens de alta resolução diretamente em smartphones de ponta. Este lançamento permite que os usuários desfrutem de uma experiência de criação de imagens eficiente e conveniente em seus telefones, superando as limitações tradicionais de geração de imagens de IA que exigem grande capacidade de computação.
A principal vantagem do SnapGen reside na compacidade e eficiência de seu modelo. Comparado a geradores de imagens populares como o SDXL, o SnapGen possui apenas 379 milhões de parâmetros, cerca de um sétimo do último. Este design compacto faz com que o SnapGen não apenas ocupe menos espaço de armazenamento, mas também apresente desempenho superior em termos de velocidade. De acordo com os resultados dos testes, o SnapGen apresentou excelente desempenho na correspondência entre imagem e descrição de texto, com uma pontuação de 0,66, superando a pontuação de 0,55 do SDXL, demonstrando sua clara vantagem em termos de qualidade.
Em termos de velocidade, o SnapGen se destaca. Em um iPhone 16 Pro Max, o sistema consegue gerar uma imagem de alta qualidade com resolução de 1024×1024 pixels em aproximadamente 1,4 segundos. Essa melhoria de velocidade garante que os usuários praticamente não percebam atrasos durante o processo de criação, podendo desfrutar instantaneamente da geração de imagens.
Para alcançar essas melhorias de desempenho, a equipe de pesquisa redesenhou sistematicamente a arquitetura da rede, simplificando os parâmetros e a latência do modelo, ao mesmo tempo em que garantiu a alta qualidade da geração de imagens. Eles otimizaram especialmente a parte do decodificador, tornando-a 36 vezes menor que sistemas semelhantes. Além disso, para que o desempenho do modelo menor atingisse o nível dos modelos maiores, a equipe também utilizou métodos de aprendizado de grandes sistemas de IA como SD3 e SD3.5, desenvolvendo um processo de treinamento especial que pode ajustar dinamicamente as estratégias de aprendizado de acordo com a dificuldade da tarefa.
Com o lançamento do SnapGen, a tecnologia de geração de imagens de IA em dispositivos móveis deu um novo salto. No futuro, os usuários poderão experimentar a criação de imagens mais rápida e de maior qualidade em seus telefones, impulsionando ainda mais o progresso da criação de conteúdo em mídias sociais.