基于视觉追踪!机器人在捉人游戏中能“以智取胜”了

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
在2025年 GTC 大会上,英伟达首席执行官黄仁勋宣布,英伟达正在与迪士尼研究部门及谷歌DeepMind 合作,开发名为 “Newton” 的物理引擎。这款引擎旨在模拟机器人在现实环境中的运动,为未来的娱乐机器人提供技术支持。图源备注:图片由AI生成,图片授权服务商Midjourney迪士尼将是首批使用 Newton 技术的公司之一,预计这项技术将应用于其下一代娱乐机器人,例如受《星球大战》启发的 BDX 机器人。在黄仁勋的主题演讲中,一款 BDX 机器人更是现场登台,生动展示了其运动能力。英伟达计划
近日,深圳市科技创新局印发了《深圳市具身智能机器人技术创新与产业发展行动计划(2025-2027年)》,该计划旨在推动具身智能技术的全面发展。文件中明确提出,要构建具身智能基座以及垂直领域的大模型,标志着深圳在智能机器人领域迈出了重要一步。此次行动计划的核心在于基于世界模型以及视觉 - 触觉 - 语言 - 动作(VTLA)等多模态输入输出,开发出具备交互、预测和决策能力的具身智能大模型。这种模型不仅能够进行长序列推理(COT),而且还具备自主学习的能力,使其能够在不
在线杂货巨头Ocado近日宣布,将在其技术和财务部门裁减500个职位,这是该公司为降低运营成本而采取的措施。作为一家在财务上亏损的公司,Ocado正在利用人工智能(AI)技术来提升工程团队的生产力,以应对财务压力。Ocado目前的员工总数约为2万人,去年的裁员人数已经达到1000人。公司首席执行官蒂姆・斯坦纳(Tim Steiner)表示,这次裁员决定并不轻松,公司的目标是通过 AI 工具提高工程团队的工作效率,并减少未来的研发支出。尽管面临裁员,奥卡多仍在持续向包括美国克罗格(Kroger
最近,Figure 创始人兼 CEO 布雷特・阿德科克(Brett Adcock)发布了一种新的机器学习模型 Helix,旨在提升人形机器人在家庭环境中的应用能力。这一消息正值 Figure 宣布与 OpenAI 的合作结束仅两周,显示出他们在机器人技术领域的坚定决心。Helix 是一个 “通用型” 的视觉 - 语言 - 行动(VLA)模型,能够通过视觉数据和语言指令来实时控制机器人。它的工作原理与谷歌 DeepMind 的 RT-2相似,后者通过视频与大型语言模型的结合训练机器人。Helix 则更进一步,它展示了强大的物体通用性,能够识别
在机器人技术领域,美国创业公司 Figure AI 于近期发布了一款名为 Helix 的端侧大模型,标志着人形机器人控制技术的重大突破。Helix 是首个能够对整个人形机器人上半身(包括头部、躯干、手腕和手指)进行高频率、连续控制的视觉 - 语言 - 动作(VLA)模型。这意味着,机器人可以在无需大量训练的情况下,直接根据自然语言指令执行任务。Figure AI 通过建立两个互补的系统来解决视觉语言模型的通用性和速度之间的矛盾。系统一是一个快速反应的视觉运动策略模型,能够每秒执行200次精确动
近日,微软研究团队联合多所高校的研究人员,发布了一款名为 “Magma” 的多模态 AI 模型。这款模型的设计旨在处理和整合图像、文本和视频等多种数据类型,以便在数字和物理环境中执行复杂任务。随着科技的不断进步,多模态 AI 代理正在被广泛应用于机器人技术、虚拟助手和用户界面自动化等领域。以往的 AI 系统通常专注于视觉 - 语言理解或机器人操作,难以将这两种能力结合成一个统一的模型。许多现有模型虽然在特定领域内表现良好,但在不同应用场景中的泛化能力较差。例如
根据最新报道,苹果公司正在积极探索机器人技术,计划开发人形和非人形机器人。这些机器人目前处于内部验证阶段,苹果希望将其整合进智能家居生态系统中。分析师郭明錤在社交平台上透露,苹果的重点是用户与机器人的互动体验,而不是机器人本身的外观设计。苹果的设计理念与三星的智能家居机器人 Ballie 有些相似。Ballie 外形像个篮球,能够在家庭中执行任务,如迎接主人、投影通知等。苹果也正在研究类似的机器人,力求为用户提供更方便的智能家居体验。此外,去年11月,
Hugging Face与Physical Intelligence联手推出了划时代的机器人基础模型Pi0,这是首个能将自然语言命令直接转化为机器人动作的开源模型,标志着机器人技术进入新纪元。Pi0模型在七个不同机器人平台上经过训练,掌握了68种独特任务,能够执行从折叠衣物到收拾桌子等复杂操作。该模型采用创新的流匹配技术,以50Hz的频率生成平滑的实时动作轨迹,确保了极高的精确度。更值得注意的是,研发团队同步推出了升级版Pi0-FAST,采用全新的频率空间动作序列标记方案,使训练速度提升5倍,并展现出
OpenAI 近日向商标局提交了一份新的申请,内容显示该公司可能正在进军人形机器人领域。根据1月31日提交的申请,OpenAI 计划推出多款新产品,尤其提到 “可用户编程的人形机器人”,以及具备交流和学习功能的机器人,旨在为人们提供帮助和娱乐。此外,OpenAI 还在积极招聘新的机器人团队成员。根据公司官网的招聘信息,目前开放了机械产品工程师、机器人和高级研究工程师等多个职位。这些新员工将加入 OpenAI 的机器人团队,致力于实现通用机器人技术的发展,朝着动态真实场景中的
在机器人技术的发展中,模拟环境与现实世界之间的差距一直是一个重大挑战。近日,英伟达 GEAR 实验室与卡内基梅隆大学的研究团队联合开发了一种新框架,名为 ASAP(Aligning Simulation and Real Physics),旨在缩小这种差距。该系统在减少机器人模拟与现实运动误差方面取得了显著进展,能够降低约53% 的运动误差,相较于现有方法具有明显优势。ASAP 框架的工作流程分为两个阶段。首先,机器人在虚拟环境中进行训练,随后利用一种特殊模型来处理现实世界中的差异。这个模型能够学习并调