最近,法国人工智能初创公司 Mistral AI 宣布了他们的新一代语言模型 ——Ministral3B 和 Ministral8B。
这两款新模型是 “Ministraux” 系列的一部分,专为边缘设备和边缘计算场景而设计,支持高达128,000个 token 的上下文长度。这意味着这些模型不仅处理能力强大,而且可以在数据隐私和本地处理尤为重要的情况下使用。
Mistral 表示,Ministraux 系列模型非常适合于一系列应用,例如本地翻译、离线智能助手、数据分析以及自主机器人技术。为了进一步提升效率,Ministraux 模型还可以与更大的语言模型(比如 Mistral Large)结合使用,作为多步骤工作流中的有效中介。
在性能上,Mistral 提供的基准测试显示,Ministral3B 和8B 在多个类别中都超过了许多同类模型,比如歌的 Gemma22B 和 Meta 的 Llama3.18B。值得一提的是,尽管 Ministral3B 的参数数量较少,但在某些测试中,它的表现超越了其前身 Mistral7B。
实际上,Mistral8B 在所有测试中都表现优异,尤其是在知识、常识、功能调用和多语言能力等方面。
关于定价,Ministral AI 的这两款新模型已经可以通过 API 获取。Ministral8B 的费用为每百万个 token0.10美元,而 Ministral3B 则是0.04美元。此外,Mistral 还为研究用途提供了 Ministral8B Instruct 的模型权重。值得注意的是,Mistral 的这两款新模型很快也会通过谷歌 Vertex 和 AWS 等云合作伙伴上线。
划重点:
- 🚀 Mistral AI 推出 Ministral3B 和8B,支持高达128,000个 token 的上下文长度。
- 💡 这两款模型适合本地翻译、离线助手、数据分析和自主机器人等应用。
- 💰 定价方面,Ministral8B 每百万 token 费用为0.10美元,Ministral3B 为0.04美元。