近日,一项新的研究论文揭示了不同 AI 语言模型在合作能力方面的显著差异。研究团队采用了一种经典的 “捐赠者游戏”,测试了 AI 代理在多代合作中如何共享资源。结果显示,Anthropic 的 Claude3.5Sonnet 表现出色,成功建立了稳定的合作模式,获得了更高的资源总量。而谷歌的 Gemini1.5Flash 和 OpenAI 的 GPT-4o 则表现不佳,尤其是 GPT-4o 在测试中逐渐变得不合作,Gemini 代理的合作程度也十分有限。研究团队进一步引入了惩罚机制,以观察不同 AI 模型的表现变化。结果发现,Claude3.5的表现有了显
最近,Answer.AI 和 LightOn 联合发布了开源语言模型 ModernBERT,这是对谷歌 BERT 的重大升级。根据开发者的介绍,ModernBERT 在处理速度、效率和质量上都有了显著提升。该模型可以比其前身快四倍,同时使用更少的内存。ModernBERT 的设计允许它处理长达8192个标记的文本,这比现有编码模型的典型512标记限制提高了16倍。此外,ModernBERT 还是首个经过广泛训练的编程代码编码模型,它在 StackOverflow 问答数据集上的得分超过80,创造了编码模型的新纪录。在通用语言理解评估(GLUE)中,ModernBERT-Large
近日,谷歌 DeepMind 与机器人公司 Apptronik 宣布达成合作,计划共同开发能够在动态环境中运作的 AI 驱动人形机器人。该合作旨在将 Apptronik 的机器人硬件与谷歌 DeepMind 的人工智能技术相结合,打造可以在复杂环境中工作的机器人。Apptronik 成立于2016年,源自德克萨斯大学奥斯汀分校的人机中心机器人实验室,目前已开发出15种不同型号的机器人,其中包括 NASA 的 Valkyrie 机器人。此次合作的重点是 Apptronik 最新推出的 Apollo 机器人,身高1.73米,重量73公斤,专为工业环境设计,能够与人类协作
在人工智能领域竞争日益激烈的背景下,谷歌近日宣布推出 Gemini2.0 Flash Thinking模型。这一多模态推理模型具备快速且透明的处理能力,能够应对复杂问题。谷歌首席执行官桑达尔・皮查伊在社交媒体 X 上表示:“这是我们迄今为止最具深度的模型。” 根据开发者文档,Gemini2的Flash Thinking比基础版本的 Gemini2.0Flash模型具备更强的推理能力。新模型支持32,000个输入标记(大约50到60页文本),输出响应可以达到8,000个标记。谷歌在其 AI 工作室的侧边面板中表示,这一模型特别适用于 “多模态