Alibaba publie FLUX.1-Turbo-Alpha : un modèle Lora distillé en 8 étapes basé sur FLUX.1-dev

L'équipe créative d'Alimama a récemment publié FLUX.1-Turbo-Alpha, un modèle Lora distillé en 8 étapes basé sur le modèle FLUX.1-dev.

Ce modèle utilise un discriminateur multi-têtes, améliorant considérablement la qualité de la distillation. Il prend en charge plusieurs applications liées à FLUX, telles que la génération d'images à partir de texte et la réparation des réseaux de contrôle. L'équipe recommande un facteur d'échelle de guidage de 3,5 et un facteur d'échelle Lora de 1. Des versions avec moins d'étapes seront disponibles prochainement.

FLUX.1-Turbo-Alpha est directement compatible avec le framework Diffusers. Quelques lignes de code suffisent pour charger le modèle et générer les images souhaitées. Par exemple, vous pouvez créer une scène amusante : un paresseux souriant portant une veste en cuir, un chapeau de cow-boy, une jupe à carreaux et un nœud papillon, debout devant un minibus Volkswagen lisse orné d'un paysage urbain. Un simple ajustement des paramètres permet de générer des images de haute qualité en résolution 1024x1024.

De plus, ce modèle est compatible avec ComfyUI, permettant un workflow rapide de texte à image ou une génération plus efficace dans la réparation des réseaux de contrôle. Grâce à cette technologie, les images générées suivent fidèlement le rendu initial, améliorant ainsi l'expérience utilisateur.

Le processus d'entraînement de FLUX.1-Turbo-Alpha est également remarquable. Le modèle a été entraîné sur plus d'un million d'images provenant de ressources open source et internes, avec une note esthétique supérieure à 6,3 et une résolution supérieure à 800. L'équipe a utilisé l'entraînement antagoniste pour améliorer la qualité des images et a ajouté une conception multi-têtes à chaque couche de transformateur. Pendant l'entraînement, le facteur d'échelle de guidage était fixé à 3,5, le décalage temporel à 3, la précision mixte bf16 était utilisée, avec un taux d'apprentissage de 2e-5, une taille de lot de 64 et une taille d'image de 1024x1024.

Le lancement de FLUX.1-Turbo-Alpha marque une nouvelle avancée d'Alimama dans le domaine de la génération d'images, favorisant la diffusion et l'application des technologies d'intelligence artificielle.

Accès au projet : https://huggingface.co/alimama-creative/FLUX.1-Turbo-Alpha

Points clés :
🌟 Ce modèle, basé sur FLUX.1-dev, utilise une distillation en 8 étapes et un discriminateur multi-têtes pour améliorer la qualité de la génération d'images.
🖼️ Il prend en charge la génération d'images à partir de texte et la réparation des réseaux de contrôle, permettant aux utilisateurs de créer facilement des scènes variées et amusantes.
📊 L'entraînement antagoniste, sur plus d'un million d'images, garantit une sortie de haute qualité.

Actualités IA

Alibaba publie FLUX.1-Turbo-Alpha : un modèle Lora distillé en 8 étapes basé sur FLUX.1-dev

AIbase基地