DeepScaleR-1.5B-Preview
一个基于强化学习优化的大型语言模型,专注于数学问题解决能力的提升。
普通产品生产力强化学习数学教育
DeepScaleR-1.5B-Preview 是一个经过强化学习优化的大型语言模型,专注于提升数学问题解决能力。该模型通过分布式强化学习算法,显著提高了在长文本推理场景下的准确率。其主要优点包括高效的训练策略、显著的性能提升以及开源的灵活性。该模型由加州大学伯克利分校的 Sky Computing Lab 和 Berkeley AI Research 团队开发,旨在推动人工智能在教育领域的应用,尤其是在数学教育和竞赛数学领域。模型采用 MIT 开源许可,完全免费供研究人员和开发者使用。
DeepScaleR-1.5B-Preview 最新流量情况
月总访问量
26103677
跳出率
43.69%
平均页面访问数
5.5
平均访问时长
00:04:43