最近,Figure 创始人兼 CEO 布雷特・阿德科克(Brett Adcock)发布了一种新的机器学习模型 Helix,旨在提升人形机器人在家庭环境中的应用能力。这一消息正值 Figure 宣布与 OpenAI 的合作结束仅两周,显示出他们在机器人技术领域的坚定决心。
Helix 是一个 “通用型” 的视觉 - 语言 - 行动(VLA)模型,能够通过视觉数据和语言指令来实时控制机器人。它的工作原理与谷歌 DeepMind 的 RT-2相似,后者通过视频与大型语言模型的结合训练机器人。Helix 则更进一步,它展示了强大的物体通用性,能够识别并拾取成千上万种在训练中未见过的家居物品,这一切只需用户用自然语言进行指令。
在展示 Helix 的过程中,Figure 提供了一些实际应用的例子。例如,用户可以告诉机器人 “把右边的饼干袋递给我”,或者 “从左边的机器人那里接过饼干袋,并放入打开的抽屉中”。这些任务的完成需要机器人之间的合作,Helix 被设计为同时控制两个机器人,以便共同执行多种家务。
尽管家务机器人仍面临许多挑战,但 Figure 强调,家庭环境的复杂性需要优先考虑。与工业环境不同,家庭中的物品种类繁多且环境变化不定,给机器人学习和控制带来了巨大的困难。此外,目前家用机器人的高昂价格使得许多公司难以在这一领域发力,通常的做法是先为工业客户提供服务,待技术成熟后再转向家庭市场。
在2024年,TechCrunch 记者参观了 Figure 位于湾区的办公室,阿德科克展示了其人形机器人在家庭环境中的表现。当时,Figure 的重点似乎仍然在与企业合作的项目上。然而,随着 Helix 的发布,Figure 希望将家庭环境作为其技术开发的一个重要方向。
如今,Helix 仍处于初步阶段,Figure 希望借助这项新技术吸引更多工程师参与其中,以加快项目的推进。对于机器人来说,能够在家中生成智能的新行为至关重要,而这需要大量的训练和调整。
官方介绍:https://www.figure.ai/news/helix
划重点:
🛠️ Helix 是一种新型的视觉 - 语言 - 行动模型,能够通过自然语言指令控制机器人执行家务任务。
🤖 该模型展示了强大的物体识别能力,能够拾取未见过的家居物品。
🏡 Figure 公司希望将家庭环境作为机器人技术发展的重点,以解决家务机器人面临的复杂挑战。