Sana_600M_1024px
Estrutura de geração de imagens a partir de texto de alta resolução e alta eficiência
Produto ComumImagemTexto para imagemAlta resolução
Sana é uma estrutura de geração de imagens a partir de texto desenvolvida pela NVIDIA, capaz de gerar imagens de alta resolução, até 4096×4096 pixels, de forma eficiente. Sua velocidade e capacidade de alinhamento texto-imagem são notáveis, permitindo até mesmo a implantação em GPUs de notebooks. É um modelo baseado em transformador de difusão linear (modelo generativo de imagem a partir de texto), com 1648M de parâmetros, especializado na geração de imagens com múltiplas escalas de altura e largura, com base em 1024px. As principais vantagens do modelo Sana incluem a geração de imagens de alta resolução, a velocidade rápida de síntese e a forte capacidade de alinhamento texto-imagem. O modelo Sana é baseado em código aberto, disponível no GitHub, e segue a licença CC BY-NC-SA 4.0.
Sana_600M_1024px Situação do Tráfego Mais Recente
Total de Visitas Mensais
29742941
Taxa de Rejeição
44.20%
Média de Páginas por Visita
5.9
Duração Média da Visita
00:04:44