OpenAI在经过12天的技术分享直播活动后,于最后一天发布了其下一代推理模型o3,这是继早前发布的o1推理模型之后的升级版本。o3模型系列包括o3和o3-mini两个版本,其中o3-mini是针对特定任务进行微调的更小的精简版模型。OpenAI表示,o3模型在某些条件下可以接近实现通用人工智能(AGI),即能完成人类所能完成的任何任务的人工智能。
据知情人士透露,AI搜索引擎初创公司Perplexity AI在本月早些时候完成了一轮 5 亿美元的融资,使其估值飙升至 90 亿美元。这意味着该公司在短短六个月内,估值增长了两倍。此前,软银在 6 月份的一笔投资将该公司估值定为 30 亿美元。此次融资由Institutional Venture Partners领投。CNBC在 11 月也曾报道称,Perplexity即将完成来自IVP的投资。Perplexity和Institutional Venture Partners的发言人均拒绝置评。图源备注:图片由AI生成,图片授权服务商MidjourneyPerplexity是今年估值大幅膨胀的众多热门AI初创公司之一
近日,阿里巴巴 Qwen 团队的研究人员推出了一个名为 “PROCESSBENCH” 的新基准测试,旨在衡量语言模型在数学推理中识别过程错误的能力。随着语言模型在复杂推理任务中取得显著进展,这一领域的研究者们发现,尽管模型表现出色,但在处理某些困难问题时依然面临挑战。因此,开发一种有效的监督方法显得尤为重要。当前,针对语言模型的评估基准存在一些不足之处。一方面,一些问题集对于高级模型而言变得过于简单,另一方面,现有的评估方法往往只提供二元的正确性评估,而缺
Perplexity AI 近日宣布,其出版商计划迎来十余家国际媒体的新合作伙伴,标志着其与新闻行业融合迈向新阶段。新加入的合作伙伴包括 ADWEEK、洛杉矶时报、墨西哥新闻日报、stern、ntv 和《世界历史百科全书》等,同时扩展了现有的《时代》杂志、《财富》杂志和《明镜》杂志等合作阵容。合作模式与吸引力作为合作的一部分,Perplexity 将与出版商共享广告收入,并为其提供 API、开发者工具和免费的 Enterprise Pro 许可证。这种合作模式吸引了许多行业关注,尤其是在 Jessica Chan(曾负责 LinkedIn