机器人领域迎来重大突破!星动纪元近日发布了其自主研发的端到端原生机器人大模型ERA-42,并将其与自研的五指灵巧手星动XHAND1相结合,首次实现了仅凭一个具身大模型,即可驱动灵巧手完成超过100项复杂精细的操作任务。这其中包括拿起螺钉并用钻紧固、用锤子敲打钉子、扶正水杯并倒水等高难度动作,标志着机器人智能化水平迈上了一个新台阶。

ERA-42的强大之处在于其卓越的通用性和灵巧操作能力。它无需任何预编程技能,就能在短时间内学会新任务。通过少量数据收集,ERA-42能够在不到两小时内掌握新技能,并持续快速学习更多新任务。

image.png

星动纪元认为,具身大模型是开启通用具身智能体的关键,而一个优秀的具身大模型需要具备三个核心要素:第一,统一一个模型泛化多种任务和环境,通过融合视觉、语言、触觉和身体姿态等全模态信息,实现对不同任务和环境的泛化能力;第二,端到端,从接收全模态数据到生成最终决策和动作,通过简洁的神经网络链路完成,无需人为干预,实现实时适应;第三,Scaling up(规模化),通过持续的数据积累实现自我完善,提升性能和泛化能力。

为了实现端到端学习,星动纪元采用了大规模视频数据学习策略,涵盖了无标注的视频数据、各类机器人数据、人类活动数据以及遥操作数据等,并在此基础上学习行动结果,有效降低了数据收集成本。更进一步,星动纪元还将世界模型融入原生机器人大模型中,让机器人不仅具备行动能力,还具备了对物理世界的理解能力,能预测未来行动轨迹并迅速响应外部干扰,在任务执行过程中不断优化行为。

image.png

相比传统的夹爪机器人,基于ERA-42的五指灵巧手星动XHAND1能够使用更多工具,执行更复杂、更精细的操作任务。例如,经过简单的彩色方块抓取数据训练,ERA-42就能成功实现对从未见过的多样化物体的抓取泛化。在面对单任务或长序列任务时,ERA-42也展现出了强大的抗干扰能力,随着模型规模的扩大,任务成功率也显著提升。

为了构建通用具身智能体,星动纪元还推出了为AI定义的全新硬件平台。以星动XHAND1为例,它拥有12个主动自由度,并采用纯电驱方式实现全自主五指关节驱动。每个手指还配备了高分辨率触觉阵列传感器,能提供精确的三维力触觉和温度信息。

依托ERA-42,星动纪元通用人形机器人执行任务的通用性和泛化性将大幅提升。结合其此前发布的稳定行走和奔跑能力,以及上下肢协同作业能力,潜在应用场景将更加多元化,有望真正实现原生通用具身智能体的产业化落地。这项技术的突破,无疑将加速机器人走进千家万户,在各行各业发挥更大的作用。