Open-MAGVIT2

Proyecto de modelo de generación de imágenes autoregresivo de código abierto

Producto ComúnImagenGeneración de imágenesModelo autoregresivo
Open-MAGVIT2 es una serie de modelos de generación de imágenes autoregresivos de código abierto desarrollados por Tencent ARC Lab, que incluye modelos de diferentes escalas, desde 300M hasta 1.5B parámetros. Este proyecto reproduce el tokenizador MAGVIT-v2 de Google, logrando un rendimiento de reconstrucción de vanguardia de 1.17 rFID en el conjunto de datos ImageNet 256×256. Mediante la introducción de la técnica de tokenización asimétrica, que descompone el vocabulario grande en subvocabularios de diferentes tamaños, y la incorporación de la predicción del 'siguiente subtoken', se mejora la interacción entre los subtokens y se aumenta la calidad de la generación. Todos los modelos y el código se han publicado como código abierto para impulsar la innovación y la creatividad en el campo de la generación de imágenes autoregresivas.
Abrir sitio web

Open-MAGVIT2 Situación del tráfico más reciente

Total de visitas mensuales

474564576

Tasa de rebote

36.20%

Páginas promedio por visita

6.1

Duración promedio de la visita

00:06:34

Open-MAGVIT2 Tendencia de visitas

Open-MAGVIT2 Distribución geográfica de las visitas

Open-MAGVIT2 Fuentes de tráfico

Open-MAGVIT2 Alternativas