谷歌Gemini Exp 1114横空出世！首战碾压GPT-4，多项能力评测登顶引业界震动

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年11月15号 9:55

599

谷歌DeepMind最新推出的Gemini实验版本（Exp1114）在Chatbot Arena平台上取得了令人瞩目的成绩。经过一周多的社区测试，累计超过6000票的数据显示，这款新模型以显著优势超越竞品，在多个关键领域展现出惊人实力。

在总体评分上，Gemini-Exp-1114以超出40分的优异成绩与GPT-4-latest并列第一，超越了此前领先的GPT-4-preview版本。更令人惊叹的是，该模型在数学、复杂提示和创意写作等核心领域全面登顶，展现出极强的综合实力。

具体来看，Gemini-Exp-1114的进步令人印象深刻:

在总排名中从第3名一举跃升至榜首

数学能力评测从第3名升至第1名

复杂提示处理从第4名攀升至第1名

创意写作表现从第2名进步到第1名

视觉处理能力同样位居榜首

编程水平也从第5名提升至第3名

Google AI Studio已正式上线这一新版本，供用户实际体验。不过，社区也对一些具体问题表示关注，比如1000个token的限制是否仍然存在，以及如何处理超长文本输出等实际应用问题。

业内分析认为，这次突破性进展显示出谷歌在AI领域的长期投入开始收获成果。有趣的是，模型在风格控制方面维持第4名的排名，这可能暗示开发团队主要采用了新的后训练方法，而非对预训练模型进行改动。

这一重大突破也引发了对行业格局的讨论。OpenAI此前常在竞争对手发布重要更新时推出新产品，但这次谷歌的进步幅度之大，令业界为之侧目。有观点认为，这可能预示着Gemini2的到来，谷歌在大模型领域的竞争力正在显著提升。

AI 药物革命来临：谷歌 DeepMind CEO 称 2025 年或将开启新药临床试验！

在近日于达沃斯举办的世界经济论坛上，谷歌 DeepMind 的首席执行官德米斯・哈萨比斯（Demis Hassabis）表示，人工智能帮助设计的首批药物可能将在2025年前开始临床试验。哈萨比斯也是 DeepMind 旗下药物研发公司 Isomorphic Labs 的负责人。他表示:“我们的计划是在今年年底前让一些 AI 设计的药物进入临床试验。”图源备注：图片由AI生成，图片授权服务商Midjourney自2021年以来，Isomorphic Labs 致力于利用机器学习加速药物开发。哈萨比斯提到，未来有望实现个性化医疗，AI 系统可以在短时间内为每

字节跳动发布豆包大模型1.5Pro，性能超越GPT-4o与Claude3.5Sonnet

字节跳动正式推出其最新的豆包大模型1.5Pro（Doubao-1.5-pro），这一新模型在多个领域的综合能力上表现出色，成功超越了行业内知名的 GPT-4o 和 Claude3.5Sonnet。该模型的发布标志着字节跳动在人工智能领域又向前迈出了重要一步。豆包1.5Pro 采用了新型的稀疏 MoE（混合专家）架构，使用较小的激活参数进行预训练。这种设计的创新之处在于其可以提供等效于7倍激活参数的 Dense 模型性能，使其在效率上远超行业常规的 MoE 架构，带来了约3倍的效率提升。这样的设计使得豆包大模型在知识、代码

谷歌全新升级Gemini 2.0 Flash Thinking，长上下文处理能力再创新高

谷歌于2025年1月22日正式发布了其 Gemini2.0Flash Thinking 推理模型的增强版，再次夺回 Chatbot Arena 的榜首。此版本的升级主要集中在长上下文的处理能力上，能够支持高达1M token 的输入，为用户在处理长篇文本时提供了更深入的分析能力。谷歌 AI 负责人 Jeff Dean 在发布会上表示，此次实验性更新旨在提高模型的可靠性，并减少模型生成的思想与最终答案之间的矛盾。Gemini2.0Flash Thinking 不仅延续了原有版本的优点，还新增了基于思维（thoughts）增强推理能力的功能，表现出色。在技术层面，Gemini2

谷歌即将推出全新升级版Gemini AI模型，推理能力大幅提升

谷歌近日宣布，将于2025年1月23日发布其全新升级的 AI 模型 ——“Gemini2.0Flash Thinking Exp-0123”。该模型是现有 “Exp-1219” 的进一步优化，主要聚焦于增强推理能力以及思维透明度。随着 AI 技术的迅猛发展，谷歌致力于通过此次升级，让机器不仅能够生成答案，更能够清晰地展现出其思考过程，极大提升了用户对 AI 工作原理的理解。Gemini2.0的一大亮点在于其能够生成 “思考过程”，这一功能将为开发者和研究人员提供更大的便利。通过集成到 Google AI Studio，开发者可以利用这一工具进行更