Janus-Pro-1B
Janus-Pro-1B es un marco autorregresivo unificado de comprensión y generación multimodal.
Producto ComúnImagenMultimodalGeneración de imágenes
Janus-Pro-1B es un modelo multimodal innovador que se centra en la comprensión y generación multimodal unificada. Resuelve el conflicto entre las tareas de comprensión y generación presentes en los métodos tradicionales mediante la separación de la ruta de codificación visual, manteniendo al mismo tiempo una única arquitectura Transformer unificada. Este diseño no solo aumenta la flexibilidad del modelo, sino que también le permite destacar en tareas multimodales, incluso superando a modelos específicos para tareas individuales. El modelo se basa en DeepSeek-LLM-1.5b-base/DeepSeek-LLM-7b-base, utiliza SigLIP-L como codificador visual, admite imágenes de entrada de 384x384 y emplea un tokenizador específico para la generación de imágenes. Su naturaleza de código abierto y su flexibilidad lo convierten en un sólido candidato para la próxima generación de modelos multimodales.
Janus-Pro-1B Situación del tráfico más reciente
Total de visitas mensuales
29742941
Tasa de rebote
44.20%
Páginas promedio por visita
5.9
Duración promedio de la visita
00:04:44