Open-MAGVIT2

Open-Source-Projekt für ein autoregressives visuelles Generierungsmodell

Normales ProduktBildBildgenerierungAutoregressives Modell
Open-MAGVIT2 ist eine Serie autoregressiver Bildgenerierungsmodelle, die vom Tencent ARC-Labor entwickelt und als Open Source veröffentlicht wurde. Sie umfasst Modelle unterschiedlicher Größen, von 300M bis 1,5B Parametern. Das Projekt reproduziert den MAGVIT-v2-Tokenizer von Google und erzielt eine hochmoderne Rekonstruktionsleistung von 1,17 rFID auf dem ImageNet 256×256-Datensatz. Durch die Einführung einer asymmetrischen Tokenisierungstechnik, bei der ein großes Vokabular in unterschiedlich große Teilvokabulare zerlegt wird, und die Einführung der „Next Subtoken Prediction“-Methode zur Verbesserung der Interaktion zwischen Subtoken, wird die Generierungsqualität verbessert. Alle Modelle und der Code wurden als Open Source veröffentlicht, um Innovation und Kreativität im Bereich der autoregressiven visuellen Generierung zu fördern.
Website öffnen

Open-MAGVIT2 Neueste Verkehrssituation

Monatliche Gesamtbesuche

474564576

Absprungrate

36.20%

Durchschnittliche Seiten pro Besuch

6.1

Durchschnittliche Besuchsdauer

00:06:34

Open-MAGVIT2 Besuchstrend

Open-MAGVIT2 Geografische Verteilung der Besuche

Open-MAGVIT2 Traffic-Quellen

Open-MAGVIT2 Alternativen