国产大模型DeepSeek发布了全新的Janus-Pro多模态大模型,正式进军文生图领域。这一举动标志着DeepSeek在多模态AI技术上的重大突破。

在GenEval和DPG-Bench基准测试中,Janus-Pro-7B不仅击败了OpenAI的DALL-E3,还超越了Stable Diffusion、Emu3-Gen等热门模型。Janus-Pro采用MIT开源协议,这意味着它可以无限制地用于商业场景。DeepSeek表示,Janus-Pro是2024年11月13日发布的JanusFlow大模型的高级版本。

DeepSeek深夜发布全新多模态大模型 性能碾压OpenAI

相比前代模型,Janus-Pro优化了训练策略,扩展了训练数据,并且模型规模更大。这些改进使得Janus-Pro在多模态理解和文本到图像的指令跟踪功能方面取得了重大进步,同时增强了文本到图像生成的稳定性。

DeepSeek深夜发布全新多模态大模型 性能碾压OpenAI

尽管Janus-Pro目前只能处理384x384分辨率的图像,但考虑到其紧凑的模型规模,能达到如此水准已经令人惊艳。

作为多模态模型,Janus-Pro不仅能生成图像,还能对图片进行描述,识别地标景点,识别图像中的文字,并对图片中的知识进行介绍。

划重点: 

🌟 DeepSeek发布Janus-Pro多模态大模型,进军文生图领域。

 📈 在基准测试中,Janus-Pro-7B性能超越OpenAI的DALL-E3等热门模型。 

✅ Janus-Pro采用MIT开源协议,可无限制用于商业场景。