谷歌DeepMind与机器人合作,突破新材料领域

最近,Figure 创始人兼 CEO 布雷特・阿德科克(Brett Adcock)发布了一种新的机器学习模型 Helix,旨在提升人形机器人在家庭环境中的应用能力。这一消息正值 Figure 宣布与 OpenAI 的合作结束仅两周,显示出他们在机器人技术领域的坚定决心。Helix 是一个 “通用型” 的视觉 - 语言 - 行动(VLA)模型,能够通过视觉数据和语言指令来实时控制机器人。它的工作原理与谷歌 DeepMind 的 RT-2相似,后者通过视频与大型语言模型的结合训练机器人。Helix 则更进一步,它展示了强大的物体通用性,能够识别
在机器人技术领域,美国创业公司 Figure AI 于近期发布了一款名为 Helix 的端侧大模型,标志着人形机器人控制技术的重大突破。Helix 是首个能够对整个人形机器人上半身(包括头部、躯干、手腕和手指)进行高频率、连续控制的视觉 - 语言 - 动作(VLA)模型。这意味着,机器人可以在无需大量训练的情况下,直接根据自然语言指令执行任务。Figure AI 通过建立两个互补的系统来解决视觉语言模型的通用性和速度之间的矛盾。系统一是一个快速反应的视觉运动策略模型,能够每秒执行200次精确动
在近期于班加罗尔举办的 “投资卡纳塔克2025” 会议上,众多科技行业的领导者聚集一堂,探讨人工智能在印度的变革潜力及其影响。谷歌DeepMind的高级董事马尼什・古普塔(Manish Gupta)在会上发表了重要讲话,强调在推动技术创新的同时,应建立相应的规章制度,以确保负责任的发展。图源备注:图片由AI生成,图片授权服务商Midjourney古普塔指出,随着印度在构建基础性人工智能模型方面取得显著进展,大家都在关注人工智能对就业市场的影响。他表示,科技行业的责任在于开发可以增
近日,微软研究团队联合多所高校的研究人员,发布了一款名为 “Magma” 的多模态 AI 模型。这款模型的设计旨在处理和整合图像、文本和视频等多种数据类型,以便在数字和物理环境中执行复杂任务。随着科技的不断进步,多模态 AI 代理正在被广泛应用于机器人技术、虚拟助手和用户界面自动化等领域。以往的 AI 系统通常专注于视觉 - 语言理解或机器人操作,难以将这两种能力结合成一个统一的模型。许多现有模型虽然在特定领域内表现良好,但在不同应用场景中的泛化能力较差。例如