Mistral AI团队又悄悄搞了个大新闻。近日,他们发布了一款名为MathΣtral的数学模型,这不仅是对阿基米德2311周年的致敬,更是数学推理和科学发现领域的一次重大突破。
MathΣtral是一款专为数学推理和科学发现设计的7B模型,拥有32k的上下文窗口,这意味着它能处理更长、更复杂的数学问题。在Apache2.0许可下开源,这为学术界和开发者提供了极大的便利。
Mistral AI团队将MathΣtral贡献给科学界,希望加强在需要复杂、多步骤逻辑推理的高级数学问题上的研究。模型在STEM领域的专业特长,在各种行业标准基准测试中达到了同类别的先进推理能力。特别是在MATH基准测试中达到了56.6%,在MMLU基准测试中达到了63.47%。
MathΣtral最引人注目的是其推理能力。这个模型证明了,通过更多的推理时间计算,可以实现明显更好的结果。在MATH基准测试中,通过多数投票,MathΣtral7B的得分高达68.37%,而在64名候选人中,通过强大的奖励模型,得分更是达到了74.59%。
Mistral AI团队的这一举措,是公司支持学术项目的更广泛努力的一部分。MathΣtral的发布,是在与Project Numina合作的背景下产生的,体现了Mistral AI对学术研究的重视和支持。
MathΣtral是一个指导性模型,可以根据Mistral AI的文档进行使用或微调。模型权重托管在HuggingFace上,现在,用户可以使用misstral-inference尝试MathΣtral,并使用misstral-finetune进行适配,以满足特定需求。
Mistral AI的MathΣtral模型,不仅是技术上的一次飞跃,更是对数学和科学领域研究的一次深刻贡献。随着AI技术的不断发展,我们有理由相信,MathΣtral将为数学推理和科学发现带来更多的可能性和突破。
官网地址:https://mistral.ai/news/mathstral/