Open-MAGVIT2
Open-Source-Projekt für ein autoregressives visuelles Generierungsmodell
Normales ProduktBildBildgenerierungAutoregressives Modell
Open-MAGVIT2 ist eine Serie autoregressiver Bildgenerierungsmodelle, die vom Tencent ARC-Labor entwickelt und als Open Source veröffentlicht wurde. Sie umfasst Modelle unterschiedlicher Größen, von 300M bis 1,5B Parametern. Das Projekt reproduziert den MAGVIT-v2-Tokenizer von Google und erzielt eine hochmoderne Rekonstruktionsleistung von 1,17 rFID auf dem ImageNet 256×256-Datensatz. Durch die Einführung einer asymmetrischen Tokenisierungstechnik, bei der ein großes Vokabular in unterschiedlich große Teilvokabulare zerlegt wird, und die Einführung der „Next Subtoken Prediction“-Methode zur Verbesserung der Interaktion zwischen Subtoken, wird die Generierungsqualität verbessert. Alle Modelle und der Code wurden als Open Source veröffentlicht, um Innovation und Kreativität im Bereich der autoregressiven visuellen Generierung zu fördern.
Open-MAGVIT2 Neueste Verkehrssituation
Monatliche Gesamtbesuche
474564576
Absprungrate
36.20%
Durchschnittliche Seiten pro Besuch
6.1
Durchschnittliche Besuchsdauer
00:06:34