Recentemente, a equipe criativa da Alibaba lançou o FLUX.1-Turbo-Alpha, um modelo Lora de destilação de 8 etapas baseado no modelo FLUX.1-dev.

Este modelo utiliza um discriminador de múltiplas cabeças, melhorando significativamente a qualidade da destilação e suportando diversas aplicações relacionadas ao FLUX, como geração de imagem a partir de texto e reparo de redes de controle.

image.png

O FLUX.1-Turbo-Alpha pode ser usado diretamente com a estrutura Diffusers. Os usuários podem carregar o modelo e gerar as imagens desejadas com apenas algumas linhas de código. Por exemplo, você pode criar uma cena interessante: uma preguiça sorridente vestindo jaqueta de couro, chapéu de cowboy, saia xadrez e laço, em frente a uma van Volkswagen lisa com uma paisagem urbana pintada nela. Com um simples ajuste de parâmetros, é possível gerar imagens de alta qualidade em resolução 1024x1024.

image.png

Além disso, o modelo também é compatível com o ComfyUI, podendo ser usado para fluxos de trabalho rápidos de texto para imagem ou para gerar resultados mais eficientes em redes de controle de reparo. Com essa tecnologia, as imagens geradas seguem bem a saída original, melhorando a experiência criativa do usuário.

O processo de treinamento do FLUX.1-Turbo-Alpha também é notável. O modelo foi treinado em mais de 1 milhão de imagens de recursos abertos e internos, com uma pontuação estética superior a 6,3 e resolução acima de 800. A equipe utilizou treinamento adversarial durante o treinamento para melhorar a qualidade da imagem e adicionou um design de múltiplas cabeças para cada camada do transformador. No processo de treinamento, a escala de orientação foi fixada em 3,5, o deslocamento de tempo em 3, precisão mista bf16 foi usada, a taxa de aprendizado foi definida como 2e-5, o tamanho do lote como 64 e o tamanho da imagem como 1024x1024.

O lançamento do FLUX.1-Turbo-Alpha marca mais uma conquista da Alibaba na área de geração de imagens, impulsionando a popularização e aplicação da inteligência artificial.

Acesso ao projeto: https://huggingface.co/alimama-creative/FLUX.1-Turbo-Alpha

Destaques:

🌟 Este modelo é baseado no FLUX.1-dev, utiliza destilação de 8 etapas e um discriminador de múltiplas cabeças, melhorando a qualidade da geração de imagens.

🖼️ Suporta geração de imagem a partir de texto e reparo de redes de controle, permitindo que os usuários criem facilmente diversos cenários interessantes.

📊 O processo de treinamento utiliza treinamento adversarial, com mais de 1 milhão de imagens de treinamento, garantindo a alta qualidade da saída do modelo.