卷积神经网络挑战视觉变换器:DeepMind最新研究

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
Google DeepMind的最新视频生成模型 Veo2正式登陆Google AI Studio和Gemini API,标志着AI视频生成技术迈向新的高度。作为Google对标OpenAI Sora的旗舰产品,Veo2以其卓越的视觉真实感、物理模拟能力以及对复杂指令的精准响应,迅速成为业界焦点。Veo2:高保真视频生成的突破Veo2是Google DeepMind在视频生成领域的最新力作,支持从文本或图像提示生成高达720p分辨率、每秒24帧、时长最长8秒的视频片段,未来有望扩展至4K分辨率和更长时长。相较于前代模型,Veo2在视觉细节、运动流畅性及物理真实性上实现了
在人工智能领域不断创新的谷歌,近日宣布了一项激动人心的计划。谷歌 DeepMind 的首席执行官 Demis Hassabis 在播客节目 Possible 中透露,公司将把其 Gemini AI 模型与 Veo 视频生成模型进行整合。这一举措旨在提升 Gemini 对物理世界的理解能力,助力开发出一个真正能够在现实生活中为用户提供帮助的通用数字助手。Hassabis 指出,从一开始,Gemini 模型就被设计为一个多模态系统,能够处理多种类型的数据和信息。他表示:“我们的愿景是构建一个能够整合各种媒体形式的助手,这样它才能更好地
就在 OpenAI 宣布采纳竞争对手 Anthropic 的标准,以实现人工智能模型与数据所在系统连接的几周后,谷歌也采取了类似举措。谷歌 DeepMind 首席执行官 Demis Hassabis 周三在社交平台 X 上发文宣布,谷歌将在其 Gemini 模型和软件开发工具包 (SDK) 中增加对 Anthropic 模型上下文协议 (MCP) 的支持。但他并未透露具体的时间表。Hassabis 在帖子中写道:“MCP 是一项优秀的协议,并且正迅速成为人工智能代理时代的开放标准。期待与 MCP 团队以及其他行业参与者一同对其进行进一步开发。”MCP 允许 AI 模型从
在竞争激烈的人工智能行业中,谷歌的 AI 部门 DeepMind 采取了极端措施,以留住顶尖人才。据《商业内幕》报道,该公司在英国的部分 AI 员工签署了 “激进” 的竞业协议,这意味着这些员工在离职后的一年内不得为竞争对手工作。这种协议不仅限制了员工的职业选择,还让他们在这一年中无法参与行业内快速发展的技术进步。有报道称,这些员工在协议期间仍会领取工资,实际上相当于一段长达一年的带薪休假。然而,这种做法让一些研究人员感到被隔离,与行业的发展脱节。尽管美国
谷歌 DeepMind 近日发布了一份详尽的战略文件,阐述了其开发安全人工通用智能(AGI)的方针。AGI 被定义为在大多数认知任务中能够与人类能力相匹配或超越的系统。DeepMind 预计,目前的机器学习方法,尤其是神经网络,仍将是实现 AGI 的主要途径。该报告指出,未来的 AGI 系统有可能超越人类表现,具备在规划和决策上显著的自主性。这种技术将对医疗、教育、科学等多个领域产生深远影响。DeepMind 的首席执行官德米斯・哈萨比斯(Demis Hassabis)预测,早期 AGI 系统可能在5到10年内问世,但
Isomorphic Labs 是一家专注于人工智能药物发现的平台,成立于2021年,源自谷歌的 DeepMind。近日,该公司首次获得外部融资,共计6亿美元轮融资由 Thrive Capital 领投,参与者包括 GV 和现有投资者 Alphabet(谷歌母公司)。这笔资金将加速 Isomorphic 的 AI 药物设计引擎的进一步开发,并支持公司将其研发的药物推向临床试验的目标。Isomorphic Labs 的创始人是 DeepMind 的联合创始人德米斯・哈萨比斯(Demis Hassabis),他利用 DeepMind 在 AI 药物发现领域的技术,包括 AlphaFold,这是一种预测蛋白质三维结构的
近日,谷歌宣布推出全新开源模型 TxGemma,专为提升治疗性药物的研发效率而设计。这一模型由谷歌 DeepMind 团队基于其先进的 Gemma 模型家族微调开发,融合了强大的语言理解、科学预测以及多轮对话功能,旨在为药物研发领域带来革命性的突破。TxGemma 的发布被视为人工智能技术在生物医药领域的重要进展,有望大幅缩短药物从实验室到临床的周期,同时降低高昂的研发成本和失败率。全流程支持药物研发TxGemma 的核心优势在于其能够模拟药物研发的完整流程,从早期药物筛选到后期临床
在最新的采访中,谷歌 DeepMind 的首席执行官德米斯・哈萨比斯(Demis Hassabis)表示,预计在未来五到十年内,人工通用智能(AGI)将迎来首个形态的诞生。然而,他也指出,当前在技术上仍面临许多重要挑战。图源备注:图片由AI生成,图片授权服务商Midjourney哈萨比斯在 DeepMind 位于伦敦的办公室接受了媒体的采访。他强调,尽管现在的人工智能系统在特定任务上表现出色,但它们仍然缺乏许多基本能力。他将 AGI 定义为 “能够展现出人类所有复杂能力的系统”。在他看来,实现 AGI 的关键在
谷歌DeepMind推出了他们的秘密武器——Gemini Robotics! 这可不是你家扫地机器人那点小打小闹,而是要将AI的智慧真正注入钢铁之躯,让机器人也能像咱们一样(甚至更聪明地)在物理世界里大显身手。无所不能的“多面手”Gemini Robotics的核心在于其基于先进的Gemini2.0模型。要知道,Gemini本身就具备处理文本、图像、音频和视频的强大能力。而Gemini Robotics更进一步,让机器人拥有了理解物理空间并采取行动的“超能力”。这意味着,无论是应对文字指令、识别眼前画面、听懂你的“灵魂”语音
北京时间,2025 年 2 月 21 日:知名创意平台 Freepik 宣布,其已正式在其平台上推出 Google DeepMind 研发的最新 AI 视频生成模型 Veo 2。这一举措不仅标志着 Freepik 成为全球首家整合 Veo 2 的平台,更打破了地域限制,让非美国居民也能使用这一尖端技术。据 Freepik 官方消息,Veo 2 拥有无与伦比的真实感、精准度和流畅的动画效果,被认为是目前最先进的 AI 视频生成模型。此次与 Google 的合作,使 Freepik 在 AI 创意工具领域再次走在前沿。此前,Veo 2 的使用主要局限于特定地区,而 Freepik 的这一步