O progresso da AMD na área de IA merece atenção, especialmente suas últimas otimizações para o modelo Stable Diffusion. Recentemente, a Stability AI lançou uma versão otimizada do Stable Diffusion baseada na estrutura ONNX, o que significa que as placas de vídeo Radeon e os processadores gráficos integrados Ryzen da AMD apresentam um aumento significativo de desempenho em tarefas de IA, chegando a até 3,8 vezes mais rápido. Esse avanço não apenas reduz a diferença em relação à NVIDIA em termos de otimização do ecossistema, mas também traz benefícios reais aos usuários da AMD.

No último ano, a AMD trabalhou em estreita colaboração com diversos parceiros, incluindo fornecedores de sistemas operacionais (OSV), fabricantes de equipamentos originais (OEM) e desenvolvedores independentes de software (ISV), nas áreas de design de hardware, drivers, compiladores e modelos de aprendizado de máquina, com o objetivo de melhorar o desempenho de aplicativos de IA em hardware AMD. De acordo com dados oficiais da AMD, após uma série de otimizações, o desempenho de inferência do SDXL1.0 e SDXL Turbo em hardware AMD aumentou 3,8 vezes em comparação com o modelo PyTorch básico, enquanto o desempenho do SD3.5 aumentou 2,6 vezes.

image.png

Em aplicações práticas, a placa de vídeo RX 9070XT, ao executar os modelos SDXL1.0, SDXL Turbo, SD3.5Large e SD3.5Large Turbo, apresentou melhorias de eficiência de 3,1 vezes, 1,5 vezes, 3,3 vezes e 2,1 vezes, respectivamente. Ao mesmo tempo, a placa de vídeo Ryzen AI MAX+395 apresentou aumento de desempenho de 1,4 vezes, 3,3 vezes e 3,0 vezes para SDXL1.0, SD3.5Large e SD3.5Large Turbo, respectivamente. Essas melhorias de desempenho tornam as placas de vídeo AMD mais eficientes em aplicativos de geração de imagens e vídeos.

Além disso, a AMD destacou o modelo Stable Diffusion otimizado, usando o sufixo "_amdgpu" (por exemplo: stable-diffusion-3.5-large_amdgpu). Os usuários podem baixar essa versão otimizada nas plataformas Stability AI ou Hugging Face. Simultaneamente, a versão Amuse3.0, desenvolvida em conjunto pela AMD e TensorStack AI, também foi lançada, oferecendo uma experiência de usuário mais fluida. É importante notar que, para usar esses modelos otimizados sem problemas, a versão do driver da GPU AMD deve ser a versão de pré-visualização 24.30.31.05 ou superior, ou aguardar a versão oficial 25.4.1, que será lançada em breve.

Essa série de avanços não apenas melhora a capacidade de aplicativos de IA em placas de vídeo AMD, mas também oferece mais opções e flexibilidade para desenvolvedores e usuários que utilizam hardware AMD.