Mistral AI近日宣布推出其最新一代大型语言模型Mistral Large2,这一模型在成本效益、速度和性能方面都取得了显著突破。

模型概况

Mistral Large2是一个拥有1230亿参数的模型,具有128K的上下文窗口。它支持包括英语、法语、德语、西班牙语、意大利语、葡萄牙语、阿拉伯语、印地语、俄语、中文、日语和韩语在内的数十种语言,以及Python、Java、C、C++、JavaScript和Bash等80多种编程语言。

性能亮点

QQ_1721867063415.png

通用性能:在MMLU测试中,Mistral Large2的预训练版本达到了84.0%的准确率。

QQ_1721867086970.png

QQ_1721867110778.png

代码和推理能力:在代码生成和数学推理方面,Mistral Large2的表现与GPT-4、Claude3Opus和Llama3405B等领先模型相当。

QQ_1721867130761.png

多语言能力:在多语言MMLU基准测试中,Mistral Large2展现出卓越的多语言处理能力,特别是在英语、法语、德语等主要语言上表现出色。

指令跟随和对齐:在MT-Bench、Wild Bench和Arena Hard等基准测试中,Mistral Large2显著提升了指令跟随和对话能力。

工具使用和函数调用:模型经过训练,能够熟练执行并行和顺序函数调用,为复杂的商业应用提供强大支持。

技术特性

大幅减少"幻觉"现象,提高输出的可靠性和准确性。

增强了模型在无法找到解决方案或信息不足时的自我认知能力。

注重生成简洁且切中要点的回答,提高交互效率和成本效益。

应用和可用性

Mistral Large2现已在la Plateforme上以"mistral-large-2407"的名称提供服务。

模型权重已开放,并托管在HuggingFace上。

Mistral AI与Google Cloud Platform扩大合作,通过Vertex AI提供Managed API服务。

该模型还可通过Azure AI Studio、Amazon Bedrock和IBM watsonx.ai等云服务提供商访问。

许可和使用条件

Mistral Large2在Mistral Research License下发布,允许用于研究和非商业用途。商业用途需要获取Mistral Commercial License。

这一新模型的发布标志着Mistral AI在大型语言模型领域取得了重大进展,为人工智能应用开发者提供了更强大、更灵活的工具,有望推动各行各业的创新应用。