Open-MAGVIT2
Proyecto de modelo de generación de imágenes autoregresivo de código abierto
Producto ComúnImagenGeneración de imágenesModelo autoregresivo
Open-MAGVIT2 es una serie de modelos de generación de imágenes autoregresivos de código abierto desarrollados por Tencent ARC Lab, que incluye modelos de diferentes escalas, desde 300M hasta 1.5B parámetros. Este proyecto reproduce el tokenizador MAGVIT-v2 de Google, logrando un rendimiento de reconstrucción de vanguardia de 1.17 rFID en el conjunto de datos ImageNet 256×256. Mediante la introducción de la técnica de tokenización asimétrica, que descompone el vocabulario grande en subvocabularios de diferentes tamaños, y la incorporación de la predicción del 'siguiente subtoken', se mejora la interacción entre los subtokens y se aumenta la calidad de la generación. Todos los modelos y el código se han publicado como código abierto para impulsar la innovación y la creatividad en el campo de la generación de imágenes autoregresivas.
Open-MAGVIT2 Situación del tráfico más reciente
Total de visitas mensuales
474564576
Tasa de rebote
36.20%
Páginas promedio por visita
6.1
Duración promedio de la visita
00:06:34