谷歌旗下 Waymo 利用 Gemini 模型提升无人驾驶技术

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年10月31号 11:02

168

最近，Waymo 在自动驾驶领域又迈出了重要一步。这家公司一直以来都把与谷歌 DeepMind 的合作视作自己的竞争优势，如今，他们正在利用谷歌的多模态大型语言模型 Gemini 来提升其自动驾驶出租车的训练效果。

Waymo 发布了一篇新的研究论文，介绍了一种名为 EMMA 的 “端到端多模态模型”，该模型能够处理传感器数据，从而生成自动驾驶汽车的未来行驶轨迹。这意味着 Waymo 的无人驾驶车辆可以更智能地做出行驶决策，并能有效地避开障碍物。

这项新技术的重要性不仅在于它的创新，还因为它可能改变目前大多数大型语言模型的应用范围。Waymo 希望将 MLLM 视为其自动驾驶系统的 “一级公民”，这代表着未来的自动驾驶可能会与当前的聊天机器人或图像生成器有很大的不同。

在这篇论文中，Waymo 提到，传统的自动驾驶系统通常会为各种功能开发特定的 “模块”，包括感知、映射、预测和规划等。虽然这种方法在过去几年内取得了一些进展，但它的局限性也显而易见，尤其是在应对新的复杂环境时。Waymo 认为，像 Gemini 这样的 MLLM 可以解决这些问题，因为它们具备广泛的 “世界知识”，并且能够进行 “链式思维推理”，模拟人类的逻辑推理。

EMMA 模型被开发出来是为了帮助 Waymo 的自动驾驶出租车在复杂环境中进行导航。比如，当遇到动物或道路施工等情况时，EMMA 能够帮助无人驾驶汽车找到最佳行驶路径。不过，Waymo 也意识到 EMMA 还有一些局限性，例如目前无法处理来自激光雷达或雷达的3D 传感器输入。

Waymo 在这方面的研究还需要进一步深入，但他们希望这项成果能激励更多的研究，以应对目前存在的问题，推动自动驾驶技术的发展。

划重点:
🚗 Waymo 正在利用谷歌的 Gemini 模型开发新的自动驾驶出租车训练系统 EMMA，提升决策能力。
🌍 EMMA 模型能够处理复杂的传感器数据，帮助无人驾驶车辆智能避开障碍物。
🔍 虽然 EMMA 有潜力，但 Waymo 承认仍需进一步研究以克服其现有局限性。

谷歌发布AI科研助手:Gemini2.0驱动的虚拟科学家

谷歌日前正式宣布推出基于Gemini2.0的AI科研助手系统——AI co-scientist，旨在为科学家提供虚拟协作，从而生成新颖的研究假设和建议。这套系统不仅具备常规的文献审查和总结功能，更突破性地加入了原创知识发掘能力。AI co-scientist能够模拟科学方法的推理过程，根据已有证据和具体研究目标，为科研人员提供新颖的研究假设和建议方案。在实际应用方面，AI共同科学家已在三个关键生物医学领域取得了显着的成果。首先，在急性髓系白血病的药物再利用研究中，AI系统提出了新型药物候选

谷歌发布全新视觉语言模型 PaliGemma 2 Mix 集成多种功能助力开发者

近日，谷歌宣布推出一款全新的视觉 - 语言模型（Vision-Language Model， VLM），名为 PaliGemma2Mix。这款模型融合了图像处理与自然语言处理的能力，能够同时理解视觉信息和文本输入，并根据需求生成相应的输出，标志着人工智能技术在多任务处理方面的进一步突破。PaliGemma2Mix 的功能非常强大，它集成了图像描述、光学字符识别（OCR）、图像问答、目标检测和图像分割等多种视觉 - 语言任务，适用于多种应用场景。开发者可以通过预训练检查点(checkpoints)直接使用这款模型，或根据自己的需求

AI大语言模型幻觉排行榜：Gemini 2.0 Flash幻觉最低

近日，Vectara 发布了一份名为 “幻觉排行榜” 的报告，比较了不同大型语言模型（LLM）在总结短文档时产生幻觉的表现。这份排行榜利用了 Vectara 的 Hughes 幻觉评估模型(HHEM-2.1)，该模型定期更新，旨在评估这些模型在摘要中引入虚假信息的频率。根据最新数据，报告指出了一系列流行模型的幻觉率、事实一致性率、应答率以及平均摘要长度等关键指标。在最新的排行榜中，谷歌的 Gemini2.0系列表现出色，尤其是 Gemini-2.0-Flash-001，以0.7% 的低幻觉率位居榜首，显示出其在处理文档时几乎没有引

谷歌将Gemini从iOS主应用撤出，押注独立应用战略

谷歌日前宣布一项重大战略调整:将其人工智能助手Gemini从iOS版谷歌主应用中完全移除，转而推广其独立应用。这一决策意在加强与ChatGPT、Claude等竞争对手的直接较量，但同时也面临着用户流失的风险。据悉，谷歌已通过电子邮件向用户发出通知，明确表示"Gemini不再在谷歌应用中可用"。该公司建议iOS用户转而从App Store下载独立的Gemini应用程序，以继续使用AI助手服务。新的独立应用提供了全方位的功能升级，包括Gemini Live语音对话、与谷歌生态系统的深度整合、AI摘要生成、图像创作等特性

AI新闻资讯