Janus-Pro-1B
Janus-Pro-1B 是一个统一多模态理解和生成的自回归框架。
普通产品图像多模态图像生成
Janus-Pro-1B 是一个创新的多模态模型,专注于统一多模态理解和生成。它通过分离视觉编码路径,解决了传统方法在理解和生成任务中的冲突问题,同时保持了单个统一的 Transformer 架构。这种设计不仅提高了模型的灵活性,还使其在多模态任务中表现出色,甚至超越了特定任务的模型。该模型基于 DeepSeek-LLM-1.5b-base/DeepSeek-LLM-7b-base 构建,使用 SigLIP-L 作为视觉编码器,支持 384x384 的图像输入,并采用特定的图像生成 tokenizer。其开源性和灵活性使其成为下一代多模态模型的有力候选。
Janus-Pro-1B 最新流量情况
月总访问量
26103677
跳出率
43.69%
平均页面访问数
5.5
平均访问时长
00:04:43