Janus-Pro-1B

Janus-Pro-1B est un framework autorégressif unifié de compréhension et de génération multimodale.

Produit OrdinaireImageMultimodalGénération d'images
Janus-Pro-1B est un modèle multimodal innovant, axé sur l'unification de la compréhension et de la génération multimodales. Il résout les conflits entre les tâches de compréhension et de génération inhérents aux méthodes traditionnelles grâce à une séparation des chemins d'encodage visuel, tout en conservant une architecture Transformer unique et unifiée. Cette conception améliore non seulement la flexibilité du modèle, mais lui permet également d'exceller dans les tâches multimodales, surpassant même les modèles spécifiques à une tâche. Ce modèle est basé sur DeepSeek-LLM-1.5b-base/DeepSeek-LLM-7b-base, utilise SigLIP-L comme encodeur visuel, supporte les images d'entrée de 384x384 pixels et emploie un tokenizer spécifique à la génération d'images. Son ouverture et sa flexibilité en font un candidat de choix pour les modèles multimodaux de nouvelle génération.
Ouvrir le site Web

Janus-Pro-1B Dernière situation du trafic

Nombre total de visites mensuelles

29742941

Taux de rebond

44.20%

Nombre moyen de pages par visite

5.9

Durée moyenne de la visite

00:04:44

Janus-Pro-1B Tendance des visites

Janus-Pro-1B Distribution géographique des visites

Janus-Pro-1B Sources de trafic

Janus-Pro-1B Alternatives