CogView

Modelo Transformer para generación de imágenes a partir de texto en dominios generales

Producto ComúnImagenTransformerTexto a imagen
CogView es un modelo Transformer preentrenado para la generación de imágenes a partir de texto en dominios generales. Este modelo, con 41 mil millones de parámetros, es capaz de generar imágenes de alta calidad y gran diversidad. Su entrenamiento se basa en un enfoque de lo abstracto a lo concreto: primero se realiza un preentrenamiento para adquirir conocimiento general, y luego un ajuste fino en dominios específicos para generar imágenes, lo que mejora significativamente la calidad de la generación. Cabe destacar que el artículo también presenta dos técnicas para estabilizar el entrenamiento de modelos de gran tamaño: PB-relax y Sandwich-LN.
Abrir sitio web

CogView Situación del tráfico más reciente

Total de visitas mensuales

474564576

Tasa de rebote

36.20%

Páginas promedio por visita

6.1

Duración promedio de la visita

00:06:34

CogView Tendencia de visitas

CogView Distribución geográfica de las visitas

CogView Fuentes de tráfico

CogView Alternativas