CuMo

一种用于扩展多模态大型语言模型(LLMs)的先进架构。

普通产品编程多模态学习大型语言模型
CuMo是一种多模态大型语言模型(LLMs)的扩展架构,它通过在视觉编码器和MLP连接器中融入稀疏的Top-K门控专家混合(MoE)块,提高了模型的可扩展性,同时在推理时几乎不增加激活参数。CuMo在预训练MLP块后,初始化MoE块中的每个专家,并在视觉指令调整阶段使用辅助损失以确保专家的均衡负载。CuMo在各种VQA和视觉指令遵循基准测试中超越了其他同类模型,且完全基于开源数据集进行训练。
打开网站

CuMo 最新流量情况

月总访问量

878

跳出率

40.85%

平均页面访问数

1.6

平均访问时长

00:00:02

CuMo 访问量趋势

CuMo 访问地理位置分布

CuMo 流量来源

CuMo 替代品