PIXART LCM
Modelo de Consistência Latente (LCM) para geração rápida e controlável de imagens
Produto ComumImagemGeração de imagensModelo de Consistência Latente
O PIXART LCM é uma estrutura de síntese de imagem texto-a-imagem que integra o Modelo de Consistência Latente (LCM) e o ControlNet no modelo avançado PIXART-α. O PIXART LCM é conhecido por sua capacidade de gerar imagens de alta qualidade com resolução de 1024px por meio de um processo de treinamento eficiente. A integração do LCM no PIXART-δ acelerou significativamente a velocidade de inferência, permitindo a geração de imagens de alta qualidade em apenas 2-4 etapas. Notavelmente, o PIXART-δ alcançou a geração de imagens de 1024x1024 pixels em 0,5 segundos, representando uma melhoria de 7 vezes em comparação com o PIXART-α. Além disso, o PIXART-δ foi cuidadosamente projetado para treinamento eficiente em uma única GPU V100 de 32 GB em um dia. Com capacidade de inferência de 8 bits, o PIXART-δ pode sintetizar imagens de 1024px com restrições de memória GPU de 8 GB, aumentando significativamente sua usabilidade e acessibilidade. A adição de um módulo semelhante ao ControlNet permite o controle preciso do modelo de difusão texto-a-imagem. Introduzimos uma nova arquitetura ControlNet-Transformer, personalizada para Transformers, que permite o controle explícito e a geração de imagens de alta qualidade. Como um modelo de geração de imagens de código aberto de última geração, o PIXART-δ oferece uma opção promissora para a família de modelos de difusão estável e contribui significativamente para a síntese de imagem texto-a-imagem.
PIXART LCM Situação do Tráfego Mais Recente
Total de Visitas Mensais
29742941
Taxa de Rejeição
44.20%
Média de Páginas por Visita
5.9
Duração Média da Visita
00:04:44