Sana
Estrutura de síntese de imagens de alta resolução e alta eficiência
Produto ComumImagemSíntese de ImagensTexto para Imagem
Sana é uma estrutura de texto para imagem capaz de gerar imagens de alta resolução de até 4096×4096 pixels de forma eficiente. Ela sintetiza imagens de alta resolução e alta qualidade em velocidade extremamente rápida, mantendo um forte alinhamento texto-imagem, e pode ser implantada em GPUs de notebooks. O design central do Sana inclui um autocodificador de compressão profunda, um Transformador de Difusão Linear (DiT), um modelo de linguagem pequeno somente para decodificação como codificador de texto e estratégias de treinamento e amostragem eficientes. O Sana-0.6B é 20 vezes menor e mais de 100 vezes mais rápido em termos de taxa de transferência do que os modelos de difusão modernos de grande porte. Além disso, o Sana-0.6B pode ser implantado em uma GPU de notebook de 16 GB, gerando imagens de 1024×1024 pixels em menos de 1 segundo. O Sana torna possível a criação de conteúdo de baixo custo.
Sana Situação do Tráfego Mais Recente
Total de Visitas Mensais
95252
Taxa de Rejeição
51.14%
Média de Páginas por Visita
2.4
Duração Média da Visita
00:01:02