昆仑万维科技股份有限公司宣布,其旗下的「天工大模型4.0」o1版(Skywork o1)正式启动邀请测试。这一消息标志着公司在通用人工智能领域迈出了重要一步,旨在通过技术创新实现更高层次的人工智能应用。

Skywork o1是昆仑万维集团发布的系列模型,具备慢思考推理能力,是国内首款拥有中文逻辑推理能力的o1模型。该模型不仅在模型输出上内生了思考、计划、反思等能力,而且在标准评测集上的推理能力相较于普通模型有显著提升。此次发布的Skywork o1包括三款模型:Skywork o1Open、Skywork o1Lite和Skywork o1Preview,其中Skywork o1Open是基于Llama3.18B的开源模型,Skywork o1Lite具备完整的思考能力,而Skywork o1Preview则提供了更多样化和深入的思考过程。

微信截图_20241127101930.png

昆仑万维集团表示,Skywork o1Open在数学和代码指标上均有大幅提高,将Llama-3.1-8B的性能提升至同生态位SOTA水平,并解锁了许多轻量级模型无法解决的复杂数学任务。此外,公司还将开源两个推理任务的Process Reward Model(PRM):Skywork o1Open-PRM-1.5B 和Skywork o1Open-PRM-7B,这些模型能够对每个步骤进行打分,提升了推理和思考能力。

微信截图_20241127102006.png

Skywork o1在逻辑推理任务上的性能提升得益于昆仑万维自研的训练方案,包括推理反思能力训练、推理能力强化学习和推理planning。这些技术的应用使得Skywork o1在常识推理、逻辑推理、数学推理、伦理决策等问题上表现出色。

昆仑万维强调,Skywork o1的发布不仅是公司“All in AGI 与 AIGC”战略的重要举措,也是构建AI技术栈的重要一步。公司将继续致力于实现通用人工智能,让每个人更好地塑造和表达自我。

尝鲜地址:www.tiangong.cn