Janus-Pro-1B
Janus-Pro-1B ist ein einheitliches, multimodales, autoregressives Framework für Verständnis und Generierung.
Normales ProduktBildMultimodalBildgenerierung
Janus-Pro-1B ist ein innovatives multimodales Modell, das sich auf die einheitliche Verarbeitung von multimodalen Verständnis- und Generierungsaufgaben konzentriert. Durch die Trennung des visuellen Kodierpfads löst es Konflikte, die bei traditionellen Ansätzen in Verständnis- und Generierungsaufgaben auftreten, während gleichzeitig eine einzige, einheitliche Transformer-Architektur beibehalten wird. Dieses Design erhöht nicht nur die Flexibilität des Modells, sondern ermöglicht auch herausragende Leistungen bei multimodalen Aufgaben, die sogar spezialisierte Modelle übertreffen. Das Modell basiert auf DeepSeek-LLM-1.5b-base/DeepSeek-LLM-7b-base, verwendet SigLIP-L als visuellen Kodierer, unterstützt Bildingaben mit einer Auflösung von 384x384 und einen spezifischen Bildgenerierungs-Tokenizer. Seine Open-Source-Lizenz und Flexibilität machen es zu einem starken Kandidaten für die nächste Generation multimodaler Modelle.
Janus-Pro-1B Neueste Verkehrssituation
Monatliche Gesamtbesuche
29742941
Absprungrate
44.20%
Durchschnittliche Seiten pro Besuch
5.9
Durchschnittliche Besuchsdauer
00:04:44