Open-MAGVIT2
Projet de modèle de génération d'images autoregressif open source
Produit OrdinaireImageGénération d'imagesModèle autoregressif
Open-MAGVIT2 est une série de modèles de génération d'images autoregressifs open source développés par les laboratoires ARC de Tencent, incluant des modèles de différentes tailles, de 300M à 1,5B de paramètres. Ce projet reproduit le tokenizer MAGVIT-v2 de Google et atteint des performances de reconstruction de pointe avec un rFID de 1,17 sur le jeu de données ImageNet 256×256. Grâce à l'introduction d'une technique de tokenisation asymétrique, qui décompose le vocabulaire étendu en sous-vocabulaires de tailles différentes, et à la prédiction du « prochain sous-jeton » pour améliorer l'interaction entre les sous-jetons, la qualité de génération est améliorée. Tous les modèles et le code sont open source, visant à stimuler l'innovation et la créativité dans le domaine de la génération d'images autoregressive.
Open-MAGVIT2 Dernière situation du trafic
Nombre total de visites mensuelles
474564576
Taux de rebond
36.20%
Nombre moyen de pages par visite
6.1
Durée moyenne de la visite
00:06:34