想让机器人更智能？清华团队发现机器人学习速成秘诀

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年11月12号 10:47

130

深度学习的快速发展离不开规模化的数据集、模型和计算量。在自然语言处理和计算机视觉领域，研究人员已经发现了模型性能与数据规模之间存在幂律关系。然而，机器人领域，特别是机器人操控领域，尚未建立起类似的规模化规律。

清华大学的研究团队最近发表了一篇论文，探讨了机器人模仿学习中的数据规模化规律，并提出了一种高效的数据收集策略，仅用一个下午的时间就收集了足够的数据，使得策略能够在新环境和新物体上实现约90% 的成功率。

研究人员将泛化能力分为环境泛化和物体泛化两个维度，并使用手持式夹爪在各种环境和不同物体上收集人类演示数据，并使用扩散策略对这些数据进行建模。研究人员首先关注了倒水和鼠标放置两个任务，通过分析策略在新环境或新物体上的性能如何随训练环境或物体数量的增加而变化，总结出数据规模化规律。

研究结果表明:

策略对新物体、新环境或两者的泛化能力，分别与训练物体、训练环境或训练环境-物体对的数量呈幂律关系。

增加环境和物体的多样性比增加每个环境或物体的演示数量更有效。

在尽可能多的环境中收集数据（例如32个环境），每个环境中有一个独特的操作对象和50个演示，就可以训练出一个泛化能力强的策略(成功率90%)，使其能够在新环境和新物体上运行。

基于这些数据规模化规律，研究人员提出了一种高效的数据收集策略。他们建议在尽可能多的不同环境中收集数据，每个环境中只使用一个独特的物体。当环境-物体对的总数达到32个时，通常足以训练出一个能够在新环境中操作并与以前未见过的物体交互的策略。对于每个环境-物体对，建议收集50个演示。

为了验证数据收集策略的普遍适用性，研究人员将其应用于两个新任务:折叠毛巾和拔掉充电器。结果表明，该策略同样能够在这两个新任务上训练出泛化能力强的策略。

该研究表明，只需投入相对适度的時間和资源，就可以学习到能够零樣本部署到任何环境和物体的单任务策略。为了进一步支持研究人员在这方面的努力，清华团队发布了他们的代码、数据和模型，希望能够启发该领域的进一步研究，最终实现能够解决复杂、开放世界问题的通用机器人。

论文地址：https://arxiv.org/pdf/2410.18647

NVIDIA和Arc研究所联合发布全球最大生物学 AI 模型 Evo2，助力基因组研究与设计

日前，Arc Institute 与 NVIDIA 合作，联合斯坦福大学、加州大学伯克利分校和加州大学旧金山分校的研究人员，共同推出了全球最大的生物学人工智能模型 ——Evo2。该模型以超过128，000个基因组的数据为基础，训练了9.3万亿个核苷酸，使其规模与最强大的生成性 AI 语言模型相媲美。Evo2的深度学习能力使其能够快速识别不同生物体基因序列中的模式，研究人员无需耗费数年时间。该模型能够准确识别引起人类疾病的突变，并有能力设计出与简单细菌基因组长度相当的新基因组。Evo2的开发团队

80%准确率！Meta 研发出无创脑机接口，仅凭思维就能打字

社交媒体巨头 Meta 最近宣布，他们开发了一种新设备，可以通过读取人脑的神经信号，实现文字输入。这项研究成果由 Meta 的科学家们在两项研究中详细介绍，利用先进的脑扫描技术和深度学习 AI 模型，成功地解码出人们在打字时的脑电信号，甚至能够重建出完整的句子。具体来说，这项技术依赖于一种名为磁脑电图（MEG）的扫描仪，能够捕捉大脑发出的微弱磁信号。与需要植入体内的脑机接口技术相比，这种设备的优势在于它无需进行侵入性手术，能在不对大脑进行直接操作的情况下工

算力告急！DeepSeek暂停API充值，两大模型价格策略同步调整

DeepSeek今日发布重要通知，因服务器资源紧张，即日起暂停API充值服务。公司表示，用户现有账户余额仍可继续使用，但暂不接受新的充值。与此同时，DeepSeek还宣布其产品价格调整计划。DeepSeek-chat模型的优惠期将于2025年2月8日24:00结束。优惠到期后，该模型将执行新的价格标准:输入tokens按每百万2元计费，输出tokens则为每百万8元。此外，新上线的DeepSeek-reasoner模型采用更高的定价策略，输入和输出tokens分别按每百万4元和16元收费。这一系列调整反映出AI服务提供商面临的资源压力，以及市

DeepSeek百万年薪招人实习生月薪过万

近日，知名的AI企业DeepSeek，随着用户量的快速增长，正积极扩大其员工规模。据某招聘平台显示，杭州深度求索人工智能（AI）基础技术研究有限公司，即DeepSeek，已发布了多个岗位的招聘信息，涵盖深度学习研究员、核心系统研发工程师及资深UI设计师等多个领域，工作地点位于北京或杭州。

AI新闻资讯