谷歌AI重磅推出Gemini 2.0 Flash:速度比Gemini 1.5 Pro 快两倍

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年12月12号 9:18

288

科技巨头谷歌的AI研究部门近日推出了Gemini AI模型的最新迭代——Gemini2.0Flash。这款新模型在性能上进行了显著提升，特别是在处理速度和多模态功能扩展方面。

官方表示，全球 Gemini 用户可以通过在桌面和移动 Web 的模型下拉列表中选择2.0Flash 实验版来访问聊天优化版本，并且它很快就会在 Gemini 移动应用程序中提供。明年年初，会将 Gemini2.0扩展到更多 Google 产品。

Gemini2.0Flash的一个关键发展是其增强的处理速度。谷歌表示，新模型的运行速度是前代Gemini1.5Pro的两倍，同时在各种基准测试中也展现出了更好的性能。这一速度提升意味着用户将享受到更高效的处理能力和更快的响应时间。

此外，Gemini2.0Flash在处理多样化数据类型方面也有所扩展。模型现在包括一个多模态实时API，能够实时处理音频和视频流。这使得开发者能够创建利用动态音频和视觉输入的应用程序。同时，模型还集成了原生图像生成功能，允许用户通过对话式文本提示来创建和修改图像。

除了这些核心进步，Gemini2.0Flash还包括其他几项增强功能。现在支持八种不同的声音的原生多语言音频输出，扩大了模型的全球可访问性。对工具和代理支持的改进使模型能够更有效地与外部工具和系统交互，从而完成更复杂的任务。

在软件工程任务方面，Gemini2.0Flash在SWE-bench Verified基准测试中取得了51.8%的得分，该基准测试旨在评估编码熟练度。这一结果表明了模型在协助开发者进行代码生成、调试和优化过程中的潜力。

谷歌正在将Gemini2.0Flash集成到自家的开发工具中。一个新的AI驱动代码代理Jules利用Gemini2.0Flash在Google Colaboratory中为开发者提供帮助。这一集成展示了模型在开发环境中的实际应用。

Gemini2.0Flash还包括与负责任的AI开发相关的功能。支持109种语言扩展了模型的全球可访问性。所有生成的图像和音频输出都集成了SynthID水印，提供了一种跟踪来源和解决与AI生成内容相关的潜在问题的机制。

Gemini2.0Flash的发布代表了谷歌AI模型发展的进一步步伐。专注于提高速度、扩展多模态能力和改善工具交互，为更通用和强大的AI系统做出了贡献。

随着谷歌继续开发Gemini系列模型，预计会有进一步的细化和能力扩展。Gemini2.0Flash为AI技术的持续进步及其在各个领域的潜在应用做出了贡献。

官方介绍:https://blog.google/technology/google-deepmind/google-gemini-ai-update-december-2024/#gemini-2-0-flash

划重点:
🚀 Gemini2.0Flash速度是前代的两倍，性能显著提升。
🎥️ 模型新增多模态实时API，支持音频和视频流的实时处理。
🌐️ 原生图像生成功能集成，通过文本提示创建和修改图像。

Veo 2震撼登场！Freepik携手谷歌全球首发AI视频新体验

全球知名创意资源平台Freepik宣布与科技巨头谷歌合作，率先在全球范围内推出最新一代AI视频模型——Veo 2。这一重磅消息迅速引发了广泛关注，不少用户纷纷表示，这可能是目前最先进的AI视频生成工具。据介绍，Veo2 由谷歌DeepMind团队研发，是其前代模型Veo的全面升级版。它不仅能生成高达4K分辨率的视频，还能实现长达数分钟的画面内容。更令人惊叹的是，Veo2 在真实感和动画流畅性上达到了新的高度。无论是模拟真实世界的物理效果，还是呈现细腻的人物动作和表情，这款工具都能做

Figure AI推出革命性双机协作AI模型Helix，赋能人形机器人新未来

在机器人技术领域，美国创业公司 Figure AI 于近期发布了一款名为 Helix 的端侧大模型，标志着人形机器人控制技术的重大突破。Helix 是首个能够对整个人形机器人上半身（包括头部、躯干、手腕和手指）进行高频率、连续控制的视觉 - 语言 - 动作(VLA)模型。这意味着，机器人可以在无需大量训练的情况下，直接根据自然语言指令执行任务。Figure AI 通过建立两个互补的系统来解决视觉语言模型的通用性和速度之间的矛盾。系统一是一个快速反应的视觉运动策略模型，能够每秒执行200次精确动

谷歌DeepMind高管：AI 应助力人类能力，而非取代

在近期于班加罗尔举办的 “投资卡纳塔克2025” 会议上，众多科技行业的领导者聚集一堂，探讨人工智能在印度的变革潜力及其影响。谷歌DeepMind的高级董事马尼什・古普塔（Manish Gupta）在会上发表了重要讲话，强调在推动技术创新的同时，应建立相应的规章制度，以确保负责任的发展。图源备注：图片由AI生成，图片授权服务商Midjourney古普塔指出，随着印度在构建基础性人工智能模型方面取得显著进展，大家都在关注人工智能对就业市场的影响。他表示，科技行业的责任在于开发可以增

新一代生物AI模型Evo 2揭开基因密码，助力疾病研究

近日，由 Arc Institute 和 Nvidia 联合开发的 Evo2生物 AI 模型正式发布。这一基础模型基于超过10万种生物的 DNA 数据，旨在深度解码生物学中的各种复杂现象。Evo2能够在不同生物体的基因序列中识别出研究者们需要花费多年时间才能发现的模式，极大提升了疾病相关突变的识别能力，并可以设计出与简单细菌相当的全新基因组。Evo2的训练涉及超过93万亿个核苷酸的处理，远超其前身 Evo1。其开发团队来自 Nvidia 和位于加州帕洛阿尔托的非营利生物医学研究机构 Arc Institute，还与斯坦福大学、加州

AI新闻资讯

​谷歌AI重磅推出Gemini 2.0 Flash:速度比Gemini 1.5 Pro 快两倍