谷歌新发布Gemini-Exp-1206模型横扫对手，超越ChatGPT成为AI新王

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年12月9号 10:39

1.0k

谷歌在生成 AI 领域的最新尝试引起了广泛关注。经过几个月的平淡表现后，谷歌 Gemini 迅速走上了快车道，推出了新的实验性语言模型 ——Gemini-Exp-1206。根据最新的 ChatArena 排行榜显示，这款模型在众多竞争对手中脱颖而出，成为了生成 AI 的领跑者。

Gemini-Exp-1206在 LMArena 上获得了最高的 Arena Score，达到了1379分，略高于 ChatGPT-4.0的1366分。这一得分表明，Gemini-Exp-1206在多项评估中表现出色，展现了其卓越的综合能力。此外，与之前的 Gemini-Exp-1114相比，新模型也显示出更强的性能。

那么，什么是 LMArena 呢?LMArena，也称为 Chatbot Arena，是一个用于评估大型语言模型的开源平台。这个平台由 LMSYS 和加州大学伯克利分校 SkyLab 共同开发，旨在通过实时测试和直接比较，支持社区对 LLM 性能的评估。

在排行榜中，Arena Score 代表了模型在多种任务中的平均表现，分数越高表示能力越强。尽管 GeminiExp-1206的分数高于 ChatGPT-4.0，但在投票数量上，ChatGPT-4.0依然遥遥领先，共获得了21，929票，而 Gemini-Exp-1206则收获了5052票。较高的投票数通常意味着更高的可靠性，因为这表明该模型经过了更广泛的测试。

另外，95% 置信区间的数据显示，Gemini 的 CI 为 ±10/-5，而 ChatGPT 的 CI 为 ±4/-5。这表明 Gemini 的平均得分更高，但 ChatGPT-4.0在性能稳定性方面表现更佳。

值得一提的是，Gemini 实验模型是尖端的原型设计，旨在进行测试和反馈。这些模型为开发者提供了提前体验谷歌最新 AI 进展的机会，同时展示了持续的创新。然而，这些实验模型是临时性的，可能随时更换，并不适合用于生产环境。

如果您想要免费使用 Gemini-Exp-1206，只需前往谷歌 AI Studio，登录后选择创建提示，并在设置中将模型更改为 Gemini Experimental1206，即可开始聊天。

尽管 Gemini-Exp-1206的结果相当引人注目，但仍需记住其实验性质。未来的潜力还需时间来揭示，业界期待着这一强劲竞争者的稳定发布。

项目入口:https://ai.google.dev/gemini-api/docs/models/experimental-models?hl=zh-cn

划重点:
🌟 Gemini-Exp-1206在 LMArena 排行榜上取得了1379的高分，超越了 ChatGPT-4.0的1366分。
🗳️ ChatGPT-4.0获得的投票数达到21，929票，明显高于 Gemini-Exp-1206的5052票，显示出其可靠性。
🔍 Gemini 实验模型为开发者提供了前所未有的 AI 体验机会，但仍处于测试阶段，不适合生产使用。

Veo 2震撼登场！Freepik携手谷歌全球首发AI视频新体验

全球知名创意资源平台Freepik宣布与科技巨头谷歌合作，率先在全球范围内推出最新一代AI视频模型——Veo 2。这一重磅消息迅速引发了广泛关注，不少用户纷纷表示，这可能是目前最先进的AI视频生成工具。据介绍，Veo2 由谷歌DeepMind团队研发，是其前代模型Veo的全面升级版。它不仅能生成高达4K分辨率的视频，还能实现长达数分钟的画面内容。更令人惊叹的是，Veo2 在真实感和动画流畅性上达到了新的高度。无论是模拟真实世界的物理效果，还是呈现细腻的人物动作和表情，这款工具都能做

谷歌DeepMind高管：AI 应助力人类能力，而非取代

在近期于班加罗尔举办的 “投资卡纳塔克2025” 会议上，众多科技行业的领导者聚集一堂，探讨人工智能在印度的变革潜力及其影响。谷歌DeepMind的高级董事马尼什・古普塔（Manish Gupta）在会上发表了重要讲话，强调在推动技术创新的同时，应建立相应的规章制度，以确保负责任的发展。图源备注：图片由AI生成，图片授权服务商Midjourney古普塔指出，随着印度在构建基础性人工智能模型方面取得显著进展，大家都在关注人工智能对就业市场的影响。他表示，科技行业的责任在于开发可以增

谷歌发布AI科研助手:Gemini2.0驱动的虚拟科学家

谷歌日前正式宣布推出基于Gemini2.0的AI科研助手系统——AI co-scientist，旨在为科学家提供虚拟协作，从而生成新颖的研究假设和建议。这套系统不仅具备常规的文献审查和总结功能，更突破性地加入了原创知识发掘能力。AI co-scientist能够模拟科学方法的推理过程，根据已有证据和具体研究目标，为科研人员提供新颖的研究假设和建议方案。在实际应用方面，AI共同科学家已在三个关键生物医学领域取得了显着的成果。首先，在急性髓系白血病的药物再利用研究中，AI系统提出了新型药物候选

谷歌发布全新视觉语言模型 PaliGemma 2 Mix 集成多种功能助力开发者

近日，谷歌宣布推出一款全新的视觉 - 语言模型（Vision-Language Model， VLM），名为 PaliGemma2Mix。这款模型融合了图像处理与自然语言处理的能力，能够同时理解视觉信息和文本输入，并根据需求生成相应的输出，标志着人工智能技术在多任务处理方面的进一步突破。PaliGemma2Mix 的功能非常强大，它集成了图像描述、光学字符识别（OCR）、图像问答、目标检测和图像分割等多种视觉 - 语言任务，适用于多种应用场景。开发者可以通过预训练检查点(checkpoints)直接使用这款模型，或根据自己的需求

AI新闻资讯

​谷歌新发布Gemini-Exp-1206模型横扫对手，超越ChatGPT成为AI新王