Janus-Pro-1B

Janus-Pro-1B es un marco autorregresivo unificado de comprensión y generación multimodal.

Producto ComúnImagenMultimodalGeneración de imágenes
Janus-Pro-1B es un modelo multimodal innovador que se centra en la comprensión y generación multimodal unificada. Resuelve el conflicto entre las tareas de comprensión y generación presentes en los métodos tradicionales mediante la separación de la ruta de codificación visual, manteniendo al mismo tiempo una única arquitectura Transformer unificada. Este diseño no solo aumenta la flexibilidad del modelo, sino que también le permite destacar en tareas multimodales, incluso superando a modelos específicos para tareas individuales. El modelo se basa en DeepSeek-LLM-1.5b-base/DeepSeek-LLM-7b-base, utiliza SigLIP-L como codificador visual, admite imágenes de entrada de 384x384 y emplea un tokenizador específico para la generación de imágenes. Su naturaleza de código abierto y su flexibilidad lo convierten en un sólido candidato para la próxima generación de modelos multimodales.
Abrir sitio web

Janus-Pro-1B Situación del tráfico más reciente

Total de visitas mensuales

29742941

Tasa de rebote

44.20%

Páginas promedio por visita

5.9

Duración promedio de la visita

00:04:44

Janus-Pro-1B Tendencia de visitas

Janus-Pro-1B Distribución geográfica de las visitas

Janus-Pro-1B Fuentes de tráfico

Janus-Pro-1B Alternativas