近日,银河通用科技公司联合北京智源人工智能研究院、北京大学和香港大学,隆重推出了名为 GraspVLA 的端到端具身抓取基础大模型。这一模型的问世标志着具身智能技术的一次重大突破,具备了感知、学习和环境交互的综合能力。

GraspVLA 的训练过程包括预训练和后训练两个阶段。其中,预训练阶段基于十亿帧的数据进行,确保了模型在多种场景下的高泛化性与零样本测试的能力。这意味着,模型能够在未见过的环境和任务中,仍然展现出卓越的抓取性能。这种能力的提升,预示着未来智能机器人在实际应用中的灵活性和适应性将大大增强。

机器人 人工智能 AI

图源备注:图片由AI生成,图片授权服务商Midjourney

官方还发布了七大泛化 “金标准”,这为行业提供了新的评估依据。这些标准不仅为开发者提供了明确的目标,也为科研人员在模型优化和应用实践中提供了方向。银河通用表示,GraspVLA 的推出将为机器人的自主操作、物体识别及复杂环境下的互动提供强有力的支持。

随着人工智能技术的不断进步,具身抓取技术的应用前景广阔,GraspVLA 作为这一领域的先行者,将在仓储物流、制造业、医疗服务等多个行业发挥重要作用。未来,机器人将不再局限于简单的重复性劳动,它们将能够学习和适应不同的环境,完成更复杂的任务,甚至与人类进行更为自然的互动。

在本次发布会上,参与的各大机构也表示,未来将继续致力于推动这一领域的发展,探索更多实用的应用场景。GraspVLA 的发布,象征着智能机器人向 “懂得抓取” 的新时代迈出了坚实的一步。