rStar-Math

展示小型语言模型通过自我演化深度思考掌握数学推理能力的研究成果。

普通产品教育语言模型数学推理

rStar-Math是一项研究，旨在证明小型语言模型（SLMs）能够在不依赖于更高级模型的情况下，与OpenAI的o1模型相媲美甚至超越其数学推理能力。该研究通过蒙特卡洛树搜索（MCTS）实现“深度思考”，其中数学策略SLM在基于SLM的流程奖励模型的指导下进行测试时搜索。rStar-Math引入了三种创新方法来应对训练两个SLM的挑战，通过4轮自我演化和数百万个合成解决方案，将SLMs的数学推理能力提升到最先进水平。该模型在MATH基准测试中显著提高了性能，并在AIME竞赛中表现优异。

AI新闻资讯

最新AI日报

AI 商用·开源产品库

AI 产品排行榜

AI产品提交

AI工具导航

模型库

大模型排行榜

模型供应商

大模型选型对比

大模型费用计算器

大模型竞技场

MCP服务端

MCP客户端

MCP教程与实践

MCP排行榜

MCP服务提交

MCP实验场

MCP服务调试器

GEO全景分析平台

GEO品牌监控分析

GEO排名查询工具

GEO推广链接检测

GEO排名优化系统

GEO 大模型推荐优化

模型个人电脑配置检测器

模型部署服务器配置计算器

rStar-Math

rStar-Math 最新流量情况

rStar-Math 访问量趋势

rStar-Math 访问地理位置分布

rStar-Math 流量来源

rStar-Math 替代品

InternLM-Math-Plus — 双语开源数学推理大型语言模型。

Eurus-2-7B-SFT — Eurus-2-7B-SFT是一个经过数学能力优化的大型语言模型，专注于推理和问题解决.

rStar-Math — 展示小型语言模型通过自我演化深度思考掌握数学推理能力的研究成果。

动手实战人工智能 AI By Doing — 人工智能入门教程网站，提供全面的机器学习与深度学习知识。

《人工智能安全治理框架》1.0版 — 推动人工智能安全治理，促进技术健康发展

AI数学解题器 — 智能解决数学问题，提升学习效率

MathCoder — 数学推理LLM

InternThinker — 上海人工智能实验室开发的强推理AI模型

LLaVA-o1 — 视觉语言模型，能够进行逐步推理

BlueLM蓝心大模型 — vivo自主研发的智能语言理解模型

京东人工智能开放平台 — 京东自主研发的人工智能开放平台

Llemma — 开放数学语言模型

MathΣtral — 7B规模的数学推理和科学发现模型

汉王天地大模型 — 人工智能领域的多轮对话处理专家

Xiaomi MiMo — 小米首个推理大模型MiMo开源，专为推理任务设计，性能卓越。

OLAMI 人工智能开放平台 — OLAMI是一个人工智能开放平台

DeepSeek-Coder-V2-Lite-Base — 开源代码语言模型，提升编程和数学推理能力。

讯飞星火认知大模型 — 多功能智能大模型

混元T1 — 业界首个超大规模混合 Mamba 推理模型，强推理能力。

OpenThinker-32B — OpenThinker-32B 是一款强大的开源推理模型，专为提升开放数据推理能力而设计。

Udacity人工智能学院 — 提供AI和机器学习课程

小门道 AI 人工智能 — 绘图，问答，图片处理一站式 AI 服务

Qwen2.5-Math — 世界领先的数学开源大语言模型

Orca 2 — 小型语言模型用于推理和理解任务

大模型之家 — 提供全面的人工智能大模型产业信息和创新价值研究。

DeepSeek-R1-Distill-Qwen-7B — DeepSeek-R1-Distill-Qwen-7B 是一个开源的推理模型，专注于数学、代码和推理任务。

DeepScaleR-1.5B-Preview — 一个基于强化学习优化的大型语言模型，专注于数学问题解决能力的提升。

Tandem GPT — 用尖端人工智能练习语言

Adfinite AI — 人工智能，简化。

NovaSky — NovaSky 是一个专注于代码生成和推理模型优化的人工智能技术平台。

rStar-Math

rStar-Math 最新流量情况

rStar-Math 访问量趋势

rStar-Math 访问地理位置分布

rStar-Math 流量来源

rStar-Math 替代品

InternLM-Math-Plus — 双语开源数学推理大型语言模型。

Eurus-2-7B-SFT — Eurus-2-7B-SFT是一个经过数学能力优化的大型语言模型，专注于推理和问题解决.

rStar-Math — 展示小型语言模型通过自我演化深度思考掌握数学推理能力的研究成果。

动手实战人工智能 AI By Doing — 人工智能入门教程网站，提供全面的机器学习与深度学习知识。

《人工智能安全治理框架》1.0版 — 推动人工智能安全治理，促进技术健康发展

AI数学解题器 — 智能解决数学问题，提升学习效率

MathCoder — 数学推理LLM

InternThinker — 上海人工智能实验室开发的强推理AI模型

LLaVA-o1 — 视觉语言模型，能够进行逐步推理

BlueLM蓝心大模型 — vivo自主研发的智能语言理解模型

京东人工智能开放平台 — 京东自主研发的人工智能开放平台