CogView
Modelo Transformer para generación de imágenes a partir de texto en dominios generales
Producto ComúnImagenTransformerTexto a imagen
CogView es un modelo Transformer preentrenado para la generación de imágenes a partir de texto en dominios generales. Este modelo, con 41 mil millones de parámetros, es capaz de generar imágenes de alta calidad y gran diversidad. Su entrenamiento se basa en un enfoque de lo abstracto a lo concreto: primero se realiza un preentrenamiento para adquirir conocimiento general, y luego un ajuste fino en dominios específicos para generar imágenes, lo que mejora significativamente la calidad de la generación. Cabe destacar que el artículo también presenta dos técnicas para estabilizar el entrenamiento de modelos de gran tamaño: PB-relax y Sandwich-LN.
CogView Situación del tráfico más reciente
Total de visitas mensuales
474564576
Tasa de rebote
36.20%
Páginas promedio por visita
6.1
Duración promedio de la visita
00:06:34