Stable Diffusion 3.5 Medium é um modelo de geração de imagem a partir de texto, desenvolvido pela Stability AI, que apresenta qualidade de imagem, composição tipográfica, compreensão de prompts complexos e eficiência de recursos aprimoradas. O modelo utiliza três codificadores de texto pré-treinados fixos, melhorando a estabilidade do treinamento através da normalização QK, e introduzindo blocos de atenção dupla nas primeiras 12 camadas de transformação. Ele demonstra excelente desempenho na geração de imagens em múltiplas resoluções, consistência e adaptabilidade a diversas tarefas de texto para imagem.