Aria-Base-64K

多模态原生Mixture-of-Experts模型

普通产品生产力多模态长文本处理
Aria-Base-64K是Aria系列的基础模型之一,专为研究目的和继续训练而设计。该模型在长文本预训练阶段后形成,经过33B个token(21B多模态,12B语言,69%为长文本)的训练。它适合于长视频问答数据集或长文档问答数据集的继续预训练或微调,即使在资源有限的情况下,也可以通过短指令调优数据集进行后训练,并转移到长文本问答场景。该模型能够理解多达250张高分辨率图像或多达500张中等分辨率图像,并在语言和多模态场景中保持强大的基础性能。
打开网站

Aria-Base-64K 最新流量情况

月总访问量

19075321

跳出率

45.07%

平均页面访问数

5.5

平均访问时长

00:05:32

Aria-Base-64K 访问量趋势

Aria-Base-64K 访问地理位置分布

Aria-Base-64K 流量来源

Aria-Base-64K 替代品