GPT-4在视觉识别任务中遭遇新挑战

量子位

发布于AI新闻资讯 · 1 分钟阅读 · 2023年11月14号 14:32

最近有研究发现,GPT-4在一项视觉识别挑战任务中表现不佳,原因可能是该任务中的图片在训练集中过于常见,GPT-4是利用记忆而不是真正的视觉识别能力来解答的。这说明了即使大模型在某些任务中表现突出,也需要谨慎看待,不能因为在训练集上的成功就高估模型的泛化能力。继续提升模型的泛化性和对抗样本的鲁棒性是当前的重点研究方向之一。同时也需要警惕只在训练集上测试模型的问题,要在更广泛的样本上考察模型的泛化能力,才能更好地评估模型性能。

微软备战OpenAI的GPT-5模型，预计即将发布GPT-4.5

近日，有消息人士透露，微软正在积极准备即将发布的 OpenAI 新模型 ——GPT-4.5及 GPT-5。根据 OpenAI 首席执行官山姆・阿特曼的说法，GPT-4.5将在数周内正式推出，微软则预计最早将在下周托管这一新 AI 模型。GPT-4.5代号 “猎户座”，是 OpenAI 的下一代模型，并且是公司最后一个非链式思维（non-chain-of-thought）模型。业内人士指出，GPT-4.5的能力有望大幅超越其前任 GPT-4。图源备注：图片由AI生成，图片授权服务商Midjourney不过，眼下的焦点不仅仅停留在 GPT-4.5，微软也在期待 GPT-5的到来。根据消

微软Azure全力支撑OpenAI新模型 GPT-5或于5月下旬震撼登场

据国外媒体报道，知情人士透露微软工程师团队正加速部署服务器资源，为OpenAI即将推出的GPT-4.5和GPT-5模型做技术储备。尽管OpenAI CEO山姆·阿尔特曼（Sam Altman）近期确认GPT-4.5将在几周内亮相，但微软内部预计最快下周即可完成新模型的托管部署，这一动作暗示着生成式AI领域的技术竞赛已进入冲刺阶段。代号为Orion的GPT-4.5被视作当前技术路线的“收官之作”。虽然OpenAI未公开其具体性能参数，但内部测试显示，该模型在多模态任务处理和上下文连贯性上较前代有显著提升。值得注意的是，

微软为OpenAI即将推出的 GPT-4.5 和 GPT-5 模型积极准备服务器容量

有消息透露称，微软的工程师正在全力以赴，为 OpenAI 即将推出的 GPT-4.5和 GPT-5模型准备服务器容量。OpenAI 首席执行官山姆・阿尔特曼（Sam Altman）近日确认，GPT-4.5将在几周内发布，而微软预计将在下周推出这一新 AI 模型。被称为 Orion 的 GPT-4.5将成为 OpenAI 的下一个前沿模型，并且是该公司最后一个非思维链模型。尽管 OpenAI 已经透露 GPT-4.5的功能将比前一代 GPT-4强大得多，但他们的目光也在 GPT-5模型上，后者将包含更多重大的技术创新。根据目前的计划，微软预计 GPT-5将在今年5月底推出，

马斯克新发布的Grok 3智商堪忧，竟答错9.11和9.9哪个大

日前，马斯克及其团队在直播中正式推出了 Grok3，宣称其为 “地球上最聪明的人工智能”。马斯克还表示，Grok3在数学、科学和编程的基准测试中超越了所有主流 AI 模型，并且计划将其应用于 SpaceX 的火星任务计算中，甚至预计在未来三年内将实现诺贝尔奖级别的突破。然而，Grok3在实际测试中的表现却让人失望。在发布会之后，一些媒体针对 Grok3进行了测试，提出了一个经典问题:“9.11与9.9哪个大?” 意外的是，这款号称最聪明的 AI 未能给出正确答案，令网友们纷纷调侃其为 “天才不愿

AI新闻资讯

GPT-4在视觉识别任务中遭遇新挑战

量子位

相关AI新闻推荐

微软备战OpenAI的GPT-5模型，预计即将发布GPT-4.5

微软Azure全力支撑OpenAI新模型 GPT-5或于5月下旬震撼登场

​微软为OpenAI即将推出的 GPT-4.5 和 GPT-5 模型积极准备服务器容量

马斯克新发布的Grok 3智商堪忧，竟答错9.11和9.9哪个大

微软为OpenAI即将推出的 GPT-4.5 和 GPT-5 模型积极准备服务器容量