Poe测试表明GPT-4在主流大模型中表现最佳

歸藏的AI工具箱

发布于AI新闻资讯 · 1 分钟阅读 · 2023年10月12号 9:40

人工智能公司Poe日前与SurgeAI合作,从推理、写作、创造力和非英语语言能力4个维度对主流大模型包括GPT-4、Google PaLM、Claude 2、Llama 2 70b等进行了系统评估。结果显示,GPT-4在各个维度上的表现均最突出,尤其在英语语言任务上明显领先其他模型。Google的语言模型PaLM在非英语语言处理能力方面表现强劲,支持最广泛的语言。此外,Claude 2的推理能力仅次于GPT-4,Llama 2 70b的写作和创造力位居第三。Poe表示,此次评估采用了行业基准测试、专家评估、Elo评分等多种考量模型优劣的方式。各模型的具体得分和强项已公开发布,以便更深入地理解当前大模型的能力格局。业内人士认为,各大模型均有独特优势,开发者应当根据具体需求进行选择。

腾讯混元视频模型（Hunyuan Video）测试招募中，开源在望

近日，腾讯混元视频模型（Hunyuan Video）在 X 平台上正式公开招募测试伙伴，标志着这一前沿 AI 视频生成技术迈入关键测试阶段。根据官方透露，测试结束后，该模型有很大概率会开源，为全球 AI 社区贡献其技术成果。混元视频模型是腾讯在 AI 视频生成领域的重要创新，拥有超过13B 的参数量，是目前开源模型中规模最大的视频生成模型之一。其核心技术包括高效的时空上下文建模能力以及对复杂物理规律的精准模拟，能够生成高质量且符合真实世界逻辑的视频内容。此前，腾讯混元团队

微软备战OpenAI的GPT-5模型，预计即将发布GPT-4.5

近日，有消息人士透露，微软正在积极准备即将发布的 OpenAI 新模型 ——GPT-4.5及 GPT-5。根据 OpenAI 首席执行官山姆・阿特曼的说法，GPT-4.5将在数周内正式推出，微软则预计最早将在下周托管这一新 AI 模型。GPT-4.5代号 “猎户座”，是 OpenAI 的下一代模型，并且是公司最后一个非链式思维（non-chain-of-thought）模型。业内人士指出，GPT-4.5的能力有望大幅超越其前任 GPT-4。图源备注：图片由AI生成，图片授权服务商Midjourney不过，眼下的焦点不仅仅停留在 GPT-4.5，微软也在期待 GPT-5的到来。根据消

微软Azure全力支撑OpenAI新模型 GPT-5或于5月下旬震撼登场

据国外媒体报道，知情人士透露微软工程师团队正加速部署服务器资源，为OpenAI即将推出的GPT-4.5和GPT-5模型做技术储备。尽管OpenAI CEO山姆·阿尔特曼（Sam Altman）近期确认GPT-4.5将在几周内亮相，但微软内部预计最快下周即可完成新模型的托管部署，这一动作暗示着生成式AI领域的技术竞赛已进入冲刺阶段。代号为Orion的GPT-4.5被视作当前技术路线的“收官之作”。虽然OpenAI未公开其具体性能参数，但内部测试显示，该模型在多模态任务处理和上下文连贯性上较前代有显著提升。值得注意的是，

AI新闻资讯

Poe测试表明GPT-4在主流大模型中表现最佳

歸藏的AI工具箱

相关AI新闻推荐

腾讯混元视频模型（Hunyuan Video）测试招募中，开源在望

马斯克： Grok 3 语音模式早期测试版已上线

微软备战OpenAI的GPT-5模型，预计即将发布GPT-4.5

微软Azure全力支撑OpenAI新模型 GPT-5或于5月下旬震撼登场