Open-MAGVIT2

Projeto de modelo de geração de imagens autoregressivo de código aberto

Produto ComumImagemGeração de imagensModelo autoregressivo
O Open-MAGVIT2 é uma série de modelos de geração de imagens autoregressivos de código aberto desenvolvidos pelo laboratório Tencent ARC, incluindo modelos de diferentes escalas, de 300M a 1,5B de parâmetros. Este projeto reproduz o tokenizer MAGVIT-v2 do Google, atingindo um desempenho de reconstrução avançado de 1,17 rFID no conjunto de dados ImageNet 256×256. Através da introdução da técnica de tokenização assimétrica, que decompõe o vocabulário extenso em sub-vocabulários de diferentes tamanhos, e da introdução da predição do 'próximo sub-token' para aprimorar a interação entre os sub-tokens, a qualidade da geração é melhorada. Todos os modelos e códigos são de código aberto, com o objetivo de impulsionar a inovação e a criatividade no campo da geração de imagens autoregressivas.
Abrir Site

Open-MAGVIT2 Situação do Tráfego Mais Recente

Total de Visitas Mensais

474564576

Taxa de Rejeição

36.20%

Média de Páginas por Visita

6.1

Duração Média da Visita

00:06:34

Open-MAGVIT2 Tendência de Visitas

Open-MAGVIT2 Distribuição Geográfica das Visitas

Open-MAGVIT2 Fontes de Tráfego

Open-MAGVIT2 Alternativas