LLaMA-O1
大型推理模型框架,支持PyTorch和HuggingFace。
普通产品编程大型推理模型蒙特卡洛树搜索
LLaMA-O1是一个大型推理模型框架,它结合了蒙特卡洛树搜索(MCTS)、自我强化学习、PPO等技术,并借鉴了AlphaGo Zero的双重策略范式以及大型语言模型。该模型主要针对奥林匹克级别的数学推理问题,提供了一个开放的平台用于训练、推理和评估。产品背景信息显示,这是一个个人实验项目,与任何第三方组织或机构无关。
LLaMA-O1 最新流量情况
月总访问量
515580771
跳出率
37.20%
平均页面访问数
5.8
平均访问时长
00:06:42