Mistral-Nemo-Instruct-2407

大型语言模型,支持多语言和代码数据

普通产品编程大型语言模型多语言支持
Mistral-Nemo-Instruct-2407是由Mistral AI和NVIDIA联合训练的大型语言模型(LLM),是Mistral-Nemo-Base-2407的指导微调版本。该模型在多语言和代码数据上进行了训练,显著优于大小相似或更小的现有模型。其主要特点包括:支持多语言和代码数据训练、128k上下文窗口、可替代Mistral 7B。模型架构包括40层、5120维、128头维、1436隐藏维、32个头、8个kv头(GQA)、2^17词汇量(约128k)、旋转嵌入(theta=1M)。该模型在多种基准测试中表现出色,如HellaSwag(0-shot)、Winogrande(0-shot)、OpenBookQA(0-shot)等。
打开网站

Mistral-Nemo-Instruct-2407 最新流量情况

月总访问量

17104189

跳出率

44.67%

平均页面访问数

5.5

平均访问时长

00:05:49

Mistral-Nemo-Instruct-2407 访问量趋势

Mistral-Nemo-Instruct-2407 访问地理位置分布

Mistral-Nemo-Instruct-2407 流量来源

Mistral-Nemo-Instruct-2407 替代品