OpenAI在经过12天的技术分享直播活动后,于最后一天发布了其下一代推理模型o3,这是继早前发布的o1推理模型之后的升级版本。o3模型系列包括o3和o3-mini两个版本,其中o3-mini是针对特定任务进行微调的更小的精简版模型。OpenAI表示,o3模型在某些条件下可以接近实现通用人工智能(AGI),即能完成人类所能完成的任何任务的人工智能。
近日,阿里巴巴 Qwen 团队的研究人员推出了一个名为 “PROCESSBENCH” 的新基准测试,旨在衡量语言模型在数学推理中识别过程错误的能力。随着语言模型在复杂推理任务中取得显著进展,这一领域的研究者们发现,尽管模型表现出色,但在处理某些困难问题时依然面临挑战。因此,开发一种有效的监督方法显得尤为重要。当前,针对语言模型的评估基准存在一些不足之处。一方面,一些问题集对于高级模型而言变得过于简单,另一方面,现有的评估方法往往只提供二元的正确性评估,而缺
上海秘塔网络科技有限公司近日宣布,其旗下的AI秘塔学术搜索功能得到了显著增强,数据量增加了7倍。此次更新将索引从摘要升级为全文,覆盖了数千万篇Open Access论文,其中包括约40%的SCI论文以及《Nature》《Science》等顶级期刊论文。这一升级意味着用户可以更全面地检索和访问学术资源,提高了研究和学习的效率。
谷东科技近期推出了两款创新的“AI+AR”眼镜——全彩双目波导分体式AR眼镜Star1和全新一体式AI眼镜Star1S,此次发布的新品不仅具备强大的AI扩展功能,还结合了高端光学技术,成为消费者日常佩戴的智能助手。Star1S是业内首款全彩双目阵列光波导AR眼镜,凭借其分体式设计和全彩显示技术,带来了更高的佩戴舒适度和画面清晰度。搭载自研的多模态AI系统,Star1S能在多种环境下实现全天候长续航,适应不同场景需求。相比传统单色显示,Star1S的全彩显示效果犹如从黑白电视升级到彩色电视