Open-MAGVIT2
Projeto de modelo de geração de imagens autoregressivo de código aberto
Produto ComumImagemGeração de imagensModelo autoregressivo
O Open-MAGVIT2 é uma série de modelos de geração de imagens autoregressivos de código aberto desenvolvidos pelo laboratório Tencent ARC, incluindo modelos de diferentes escalas, de 300M a 1,5B de parâmetros. Este projeto reproduz o tokenizer MAGVIT-v2 do Google, atingindo um desempenho de reconstrução avançado de 1,17 rFID no conjunto de dados ImageNet 256×256. Através da introdução da técnica de tokenização assimétrica, que decompõe o vocabulário extenso em sub-vocabulários de diferentes tamanhos, e da introdução da predição do 'próximo sub-token' para aprimorar a interação entre os sub-tokens, a qualidade da geração é melhorada. Todos os modelos e códigos são de código aberto, com o objetivo de impulsionar a inovação e a criatividade no campo da geração de imagens autoregressivas.
Open-MAGVIT2 Situação do Tráfego Mais Recente
Total de Visitas Mensais
474564576
Taxa de Rejeição
36.20%
Média de Páginas por Visita
6.1
Duração Média da Visita
00:06:34