神仙打架！Mistral Large2突然开源：1230亿个参数、媲美Llama3.1

AIbase基地

发布于AI新闻资讯 · 2 分钟阅读 · Jul 25, 2024

443

继昨天Meta宣布发布最强开源模型Llama3.1之后，Mistral AI在今天凌晨隆重推出了其旗舰模型 Mistral Large2，这一新产品有 1230亿个参数，拥有超大的128k 上下文窗口，与从这方面来看可以媲美Llama3.1。

Mistral Large2模型详情

Mistral Large2具有128k 上下文窗口，支持法语、德语、西班牙语、意大利语、葡萄牙语、阿拉伯语、印地语、俄语、中文、日语和韩语等数十种语言，以及 Python、Java、C、C++、JavaScript 和 Bash 等80多种编码语言。

Mistral Large2专为单节点推理而设计，主要针对长上下文应用 - 其1230亿个参数的大小使其能够在单个节点上以大吞吐量运行。Mistral Large2根据 Mistral 研究许可证发布，旨在用于研究和非商业用途;若有商业需求，用户需要联系以获取商业许可证。

整体表现:

在性能方面，Mistral Large2在评估指标上建立了新的标杆，尤其是在 MMLU 基准测试中实现了84.0% 的准确率，展现出强大的性能与服务成本的平衡。

代码与推理

通过对 Codestral22B 和 Codestral Mamba 的训练经验，Mistral Large2在代码处理上表现优异，甚至与 GPT-4o、Claude3Opus 和 Llama3405B 等顶尖模型相媲美。

指令遵循与对齐

Mistral Large2在指令遵循和对话能力上也取得了显著进展，尤其是在处理复杂、多轮的对话时更加灵活。在某些基准测试中，生成较长的响应往往会提高分数。然而，在许多商业应用中，简洁性至关重要——较短的模型生成有助于加快交互速度，并且推理更具成本效益。

语言多样性

新的 Mistral Large2是在大量多语言数据上进行训练的，特别是在英语、法语、德语、西班牙语、意大利语、葡萄牙语、荷兰语、俄语、中文、日语、韩语、阿拉伯语和印地语方面表现出色。以下是 Mistral Large2在多语言 MMLU 基准上的性能结果，与之前的 Mistral Large、Llama3.1模型以及 Cohere 的 Command R+ 进行了比较。

工具使用和函数调用

Mistral Large2配备了增强的函数调用和检索技能，并经过训练，可以熟练地执行并行和顺序函数调用，使其能够作为复杂业务应用程序的动力引擎。

使用方法:

目前，用户可以在la Plateforme（https://console.mistral.ai/）使用 Mistral Large2，名称为mistral-large-2407，并在 le Chat 上进行测试。它可在版本24.07（我们应用于所有模型的 YY.MM 版本控制系统）和 API 名称下使用mistral-large-2407。instruct 模型的权重可用，并且也托管在HuggingFace上（https://huggingface.co/mistralai/Mistral-Large-Instruct-2407）。

La Plateforme 上的产品，包括两个通用模型 Mistral Nemo 和 Mistral Large，以及两个专业模型 Codestral 和 Embed。随着我们逐步弃用 La Plateforme 上的旧模型，所有 Apache 模型（Mistral7B、Mixtral8x7B 和8x22B、Codestral Mamba、Mathstral）仍可使用 SDK mistral-inference 和 mistral-finetune 进行部署和微调。

从今天开始，产品将扩展 la Plateforme 上的微调功能:这些功能现在可用于 Mistral Large、Mistral Nemo 和 Codestral。

Mistral AI 还与多家领先的云服务提供商合作，让 Mistral Large2在全球范围内可用，尤其是在 Google Cloud Platform 的 Vertex AI 中也能找到它的身影。

** 划重点:**
🌟 Mistral Large2具备128k 上下文窗口，支持多达十种语言及80多种编程语言。
📈 在 MMLU 基准测试中实现84.0% 的准确率，性能与成本表现卓越。
💻 用户可通过 La Plateforme 访问新模型，并在云服务平台上广泛应用。

Llama3.1 MistralAI MistralLarge2 参数

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

Ostris发布Flex.2-preview，8B参数扩散模型革新ComfyUI工作流

Ostris团队发布Flex.2-preview，一款基于8亿参数的文本到图像扩散模型，专为集成到ComfyUI工作流设计。据AIbase了解，该模型在基于线条、姿态和深度的控制生成能力上表现出色，支持通用控制与图像修补功能，延续了从Flux.1Schnell到OpenFlux.1、Flex.1-alpha的微调进化路径。Flex.2-preview已在Hugging Face开源，凭借Apache2.0许可证与灵活的工作流集成，迅速成为AI艺术创作社区的焦点。核心功能:通用控制与工作流无缝集成Flex.2-preview以其强大的控制能力与ComfyUI原生支持重新定义了文本到图像生成。AIbase梳理

2025年4月24号 9:09

2.4k

颠覆性开源 TTS 模型 Dia 发布:情绪、非语言提示全支持，媲美真人对话

一家名为 Nari Labs 的两人创业公司发布了 Dia，这是一个拥有16亿参数的文本转语音（TTS）模型，旨在直接从文本提示生成自然对话。其联合创始人 Toby Kim 声称，Dia 的性能超越了 ElevenLabs 等竞争对手的专有产品以及谷歌的 NotebookLM AI 播客生成功能，并可能对 OpenAI 近期发布的 gpt-4o-mini-tts 构成威胁。Kim 在社交媒体 X 上表示，Dia 在质量上可与 NotebookLM 的播客功能媲美，并优于 ElevenLabs Studio 和 Sesame 的开放模型。他透露，该模型是在“零资金”的情况下构建的，并强调他们并非一开始就是人工

2025年4月23号 9:31

3.8k

何小鹏称自研图灵AI芯片二季度上车支持运行30B参数大模型

小鹏汽车董事长何小鹏近日宣布，公司全栈自研的图灵AI芯片将提前至今年第二季度量产上车。这一进展正值汽车行业加速应用端到端智驾技术，推动AI大模型规模持续扩张的背景下。小鹏汽车通过同步开发参数量达主流VLA模型35倍的世界基座模型，以及即将量产的算力相当于3颗英伟达Orin X的自研芯片，构建其“最强AI大脑”。

2025年4月15号 13:52

7.0k

智谱开源32B/9B 系列 GLM 模型，32B参数媲美DeepSeek R1，速度快8倍

备受瞩目的国内人工智能企业智谱华章（以下简称“智谱”）近日正式宣布，开源其新一代 GLM 系列大语言模型。此次开源力度空前，不仅包含 32B 和9B 两种参数规模的模型，更涵盖了基座模型、推理模型以及代表未来探索方向的沉思模型。所有开源模型均遵循宽松的 MIT 许可协议，为开发者提供了极大的自由度和商业应用的可能性。与此同时，该系列模型已通过智谱全新平台 Z.ai 免费开放体验，并同步上线智谱 MaaS 平台（bigmodel.cn）。开源赋能:技术普惠与创新加速本次智谱开源的 GLM 模

2025年4月15号 10:52

5.1k

THUDM 发布 GLM 4：32 亿参数模型与 GPT-4o 和 DeepSeek-V3 正面竞争

在快速发展的语言模型领域，研究人员和组织面临着诸多挑战。这些挑战包括提升推理能力、提供强大的多语言支持以及有效管理复杂的开放任务。尽管较小的模型通常更容易获得且成本较低，但在性能上往往不及更大的模型。因此，开发中型模型以有效平衡计算效率与强大的推理及指令跟随能力，成为了当前的趋势。近日，清华大学发布了 GLM4，特别是其 GLM-Z1-32B-0414变体，有效应对了这些挑战。GLM4在一个包含15万亿个标记的大型数据集上进行训练，旨在提供可靠的多语言能力，并引入了

2025年4月15号 9:08

1.6k

小鹏汽车启动 720 亿参数“小鹏世界基座模型”研发

昨日，小鹏汽车在香港举办AI技术分享会，首次公布正在研发的720亿参数超大规模自动驾驶大模型——“小鹏世界基座模型”。该模型以多模态架构为核心，融合视觉理解、链式推理及动作生成能力，旨在通过云端蒸馏技术部署至车端，并同步赋能AI机器人、飞行汽车等生态产品。

2025年4月15号 8:59

950

昆仑万维开源Skywork-OR1系列模型数学代码能力出色

昆仑万维天工团队宣布推出全新升级的Skywork-OR1（Open Reasoner1）系列模型，这是继2025年2月发布首款中文逻辑推理大模型Skywork-o1之后的又一力作。该系列模型在同等参数规模下实现了业界领先的推理性能，进一步突破了大模型在逻辑理解与复杂任务求解方面的能力瓶颈。

2025年4月14号 8:50

1.9k

AI代码模型开源潮来袭：Cogito v1 Preview震撼亮相，70B性能碾压Llama 4

近日，AI代码生成领域掀起了一波开源热潮，多款重量级模型接连亮相，其中Deep Cogito推出的Cogito v1Preview系列尤为引人注目。据AIbase了解，这一全新开源模型家族涵盖3B、8B、14B、32B和70B等多种规格，不仅在性能上全面超越同级别竞争者，其70B版本更是力压Meta最新发布的Llama4109B MoE模型，成为业界热议的焦点。这一系列模型的发布，不仅为开发者提供了强大的编程利器，也预示着AI技术在编码领域的全新突破。多规格覆盖，性能领跑行业Cogito v1Preview系列提供了从3亿到70亿参数的多种选择，满

2025年4月10号 10:19

4.6k

英伟达发布Llama3.1 Nemotron Ultra 253B，性能超越Llama 4 Behemoth

2025年4月8日，英伟达（NVIDIA）宣布推出其最新大型语言模型(LLM)——Llama3.1Nemotron Ultra253B。这一模型基于Meta的Llama-3.1-405B-Instruct开发，通过创新的神经架构搜索(NAS)技术进行了深度优化，不仅在性能上超过了近期发布的Llama4系列中的Behemoth和Maverick，还以开源形式在Hugging Face平台上发布，引发了AI社区的广泛关注。性能突破:碾压Llama4Behemoth和Maverick根据英伟达官方披露的信息以及社交媒体上的最新讨论，Llama3.1Nemotron Ultra253B在多个关键基准测试中表现出色。这一模型拥有2530亿个参数，相较于Lla

2025年4月9号 9:27

1.8k

英伟达震撼发布Llama 3.1 Nemotron Ultra 253B：AI性能王者再定义行业新标杆

近日，全球芯片与AI技术巨头英伟达（NVIDIA）推出了一款全新开源大语言模型——Llama3.1Nemotron Ultra253B，引发了人工智能领域的强烈反响。这一模型基于Meta的Llama-3.1-405B打造，通过创新技术优化，不仅在性能上超越了Llama4Behemoth和Maverick等强劲对手，还以高效的资源利用率和卓越的多任务能力，为AI应用的广泛落地提供了新的可能。Llama3.1Nemotron Ultra253B拥有2530亿个参数，支持高达128K token的超长上下文长度，使其能够轻松处理复杂文本输入并保持逻辑连贯性。与前代模型相比，该版本在推理、

2025年4月9号 9:26

1.5k

AI资讯

AI日报

AI时间线

Al硬件

最新案例

图片合集

视频合集

音频合集

文案合集

最新教程

AI产品排行榜

AI产品流量增速榜

AI产品流量下降榜

AI产品周榜

美国

中国

印度

巴西

图片生成

个人助理

角色生成网站

视频生成

AI项目榜单

AI项目增速榜

AI开发者排名

AI组织排名

deepseek

TTS

LLM

ChatGPT

全景图