CuMo
一种用于扩展多模态大型语言模型(LLMs)的先进架构。
普通产品编程多模态学习大型语言模型
CuMo是一种多模态大型语言模型(LLMs)的扩展架构,它通过在视觉编码器和MLP连接器中融入稀疏的Top-K门控专家混合(MoE)块,提高了模型的可扩展性,同时在推理时几乎不增加激活参数。CuMo在预训练MLP块后,初始化MoE块中的每个专家,并在视觉指令调整阶段使用辅助损失以确保专家的均衡负载。CuMo在各种VQA和视觉指令遵循基准测试中超越了其他同类模型,且完全基于开源数据集进行训练。
CuMo 最新流量情况
月总访问量
1030
跳出率
52.96%
平均页面访问数
1.2
平均访问时长
00:00:00