Stable Diffusion 3.5 Medium est un modèle génératif d'image à partir de texte, développé par Stability AI. Il se caractérise par une qualité d'image, une mise en page et une compréhension des invites complexes améliorées, ainsi qu'une meilleure efficacité des ressources. Ce modèle utilise trois encodeurs de texte pré-entraînés fixes, améliorant la stabilité de l'entraînement grâce à la normalisation QK, et introduit des blocs d'attention double dans les 12 premières couches de transformation. Il excelle dans la génération d'images multi-résolutions, la cohérence et l'adaptabilité à diverses tâches d'image à partir de texte.