Stable Diffusion 3 é um sistema avançado de geração de imagem a partir de texto que rivaliza ou supera sistemas de ponta como DALL-E 3 e Midjourney v6 em termos de formatação e interpretação de prompts. O sistema utiliza a nova arquitetura de Transformador de Difusão Multimodal (MMDiT), empregando diferentes conjuntos de pesos para melhorar a representação de imagens e linguagem, resultando em melhor compreensão de texto e capacidade ortográfica. A Stable Diffusion 3 API está agora disponível na plataforma de desenvolvedores da Stability AI, em parceria com a Fireworks AI para fornecer um serviço de API rápido e confiável, com a promessa de disponibilizar os pesos do modelo para auto-hospedagem em breve por meio da assinatura Stability AI.