LLaMA-O1

大型推理模型框架,支持PyTorch和HuggingFace。

普通产品编程大型推理模型蒙特卡洛树搜索
LLaMA-O1是一个大型推理模型框架,它结合了蒙特卡洛树搜索(MCTS)、自我强化学习、PPO等技术,并借鉴了AlphaGo Zero的双重策略范式以及大型语言模型。该模型主要针对奥林匹克级别的数学推理问题,提供了一个开放的平台用于训练、推理和评估。产品背景信息显示,这是一个个人实验项目,与任何第三方组织或机构无关。
打开网站

LLaMA-O1 最新流量情况

月总访问量

515580771

跳出率

37.20%

平均页面访问数

5.8

平均访问时长

00:06:42

LLaMA-O1 访问量趋势

LLaMA-O1 访问地理位置分布

LLaMA-O1 流量来源

LLaMA-O1 替代品