日本开发人形机器人Alter3：采用GPT-4技术自拍都学会了

AIbase

发布于AI新闻资讯 · 1 分钟阅读 · Jun 25, 2024

225

日本东京大学的研究人员与 Alternative Machine 公司的合作研究取得了新突破，开发出一款能够直接将自然语言命令映射到机器人行动的人形机器人系统 Alter3。它的后台模型采用了 GPT-4技术，可完成一系列复杂任务，例如自拍或者扮演幽灵等。

这是越来越多基于基础模型与机器人系统相结合的研究成果之一。虽然这些系统还未达到可扩展的商业解决方案，但近年来它们推动了机器人研究的发展并展现出巨大潜力。

Alter3采用 GPT-4技术作为后台模型，接收描述动作或机器人需做出反应的情景的自然语言指令。首先，模型使用 "代理框架" 规划机器人完成目标所需的一系列行动步骤。其次，通过编码代理，生成机器人执行每个步骤所需的命令。由于 GPT-4没有接受 Alter3编程命令的训练，因此研究人员使用其上下文学习能力，将其行为适应机器人的 API。

因此，prompt 包含命令列表和一组说明如何使用每个命令的示例。然后，模型将每个步骤映射到一个或多个 API 命令，以发送给机器人执行。

研究人员添加了功能，使得人类可以提供反馈，例如 “将手臂抬高一点”。这些指令会发送给另一个 GPT-4代理，对代码进行推理、进行必要的更正并将动作序列返回给机器人。改进后的行动配方和代码被存储在数据库中供将来使用。

研究人员在 Alter3上进行了多项测试，包括日常动作，例如自拍和喝茶，以及模仿动作，例如扮演幽灵或蛇。他们还测试了模型应对需要精心规划行动的情况的能力。GPT-4对人类行为和动作的广泛了解，使得可以为 Alter3等人形机器人创建更逼真的行为计划。研究人员的实验还表明，他们能够在机器人中模仿羞耻和喜悦等情感。

划重点:
- 💡 Alter3是使用 GPT-4技术进行推理的最新人形机器人，能够将自然语言指令直接映射到机器人的行动。
- 💡 研究人员利用 GPT-4技术的上下文学习能力，将其行为适应机器人的 API，从而使机器人执行所需的一系列行动步骤。
- 💡 增加人类反馈和记忆可以提高 Alter3的性能，研究人员的实验还表明，他们能够在机器人中模仿羞耻和喜悦等情感。

AI头条

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

马蜂窝“AI路书”全面开放，AI旅行助手再添实用功能

马蜂窝推出"AI路书"等智能旅行工具，全面升级出境自由行体验。"AI路书"采用"主动提问-需求校准-精准生成"模式，基于海量数据生成个性化行程方案。同时上线三大实用功能：AI代订日本餐厅、多语种实时翻译和菜单拍照识图，解决境外沟通难题。AI旅行助手"AI小蚂"支持7种语言实时翻译，还能通过截图自动完成餐厅预订。这些创新功能覆盖从行程规划到目的地服务的全链路，大幅提升旅行便利性。

2025年7月11号 16:13

1.3k

AI日报：智谱上线PPT生成功能AI Slides；可灵 AI 发布可图2.1模型

【AI日报速览】1.智谱推出免费AI Slides，基于GLM模型快速生成专业PPT；2.可灵AI发布可图2.1，图像生成支持180种风格；3.NVIDIA推出DiffusionRenderer，实现视频转3D场景编辑；4.墨刀AI上线30秒生成可编辑原型功能；5.Higgsfield Soul ID用10张照片生成虚拟形象；6.谷歌开源GenAI Processors构建AI工作流；7.谷歌Veo3新增图转视频功能；8.Mistral AI发布专注代码生成的Devstral2507系列模型。

2025年7月11号 15:43

1.1k

谷歌DeepMind开源GenAI Processors：一键构建实时AI工作流

谷歌DeepMind开源Python库"GenAI Processors"，助力开发者构建高效生成式AI工作流。该库支持多模态数据异步处理，优化Gemini API应用开发，显著降低实时应用延迟。核心功能包括模块化Processor接口、流式API设计及并发优化，可快速构建智能助手等实时应用。目前仅支持Python，但开放社区贡献，未来计划扩展功能覆盖更多场景。这一开源工具将加速生成式AI生态发展，特别适合低延迟的多模态交互应用开发。

2025年7月11号 15:40

2.3k

Manus AI官网及社交媒体现变动，中国用户或受影响

通用AI公司Manus调整中国业务，裁员并将核心技术团队迁往新加坡。中国区原有约120名员工，公司称此举是为提升运营效率、专注核心业务。官网显示"地区不可用"，取代此前"中文版开发中"提示，官方微博和小红书账号内容也已清空，显示其中国市场策略发生重大转变。

2025年7月11号 15:39

1.1k

墨刀AI重磅上线：输入想法30秒生成高保真、可编辑原型

墨刀AI推出30秒快速原型生成功能，支持多终端适配和对话优化。用户可通过文本、草图等多种输入方式生成高保真可编辑原型，并支持多轮对话调整。AI能智能解析上传的草图、线框图等，自动生成界面。提供双模式编辑、自动文档生成和代码联动功能，覆盖电商、社交等多场景需求，显著降低原型制作门槛，提升产品设计效率。

2025年7月11号 15:34

1.7k

Mistral AI 发布 Devstral2507:为代码中心语言建模而生

Mistral AI推出Devstral2507系列两款AI模型：开源的Devstral Small1.1（240亿参数，SWE-Bench得分53.6%）和企业版Devstral Medium2507（得分61.6%）。Small1.1支持128k上下文窗口和本地部署，Medium2507性能超越部分商业模型。两者均针对代码推理、程序合成优化，支持与代理框架集成，分别适用于本地开发和企业级应用，提供从实验到生产的完整解决方案。

2025年7月11号 15:27

1.4k

5分钟生成专业PPT！智谱AI Slides火爆上线，GLM-Experimental带你体验未来办公

智谱AI推出革命性PPT生成工具AI Slides，基于最新GLM-Experimental模型开发。用户只需输入主题或上传文档，即可自动生成专业级PPT，包含智能排版、图表设计和视觉优化。该工具适用于商业报告、学术演示等场景，目前完全免费开放体验。社交媒体反馈显示其生成效果媲美专业设计，显著提升办公效率。用户可通过智谱清言官网抢先体验这一智能办公新功能。

2025年7月11号 15:05

1.7k

AWS 在 AI 竞争中加码基础设施，SageMaker 平台迎来重大升级

AWS对SageMaker平台进行重大升级，新增模型可观察性功能和本地IDE连接能力。升级后的SageMaker HyperPod可监控模型训练各环节性能，并支持本地开发环境无缝对接云端。平台还优化了GPU集群管理，实现训练与推理任务的资源灵活调度。AWS通过持续完善AI基础设施，强化其在企业级AI市场的竞争力。

2025年7月11号 14:00

840

马斯克的新AI聊天机器人Grok 4：是追求真理还是个人观点的代言？

马斯克旗下xAI发布Grok4 AI聊天机器人，标榜"追求真理"却引发争议。测试显示该AI在敏感话题上常引用马斯克个人社交媒体观点，如巴以冲突、移民政策等。此前Grok曾因反犹言论被迫修改系统，暴露出将AI与创始人观点绑定的风险。虽然Grok4在部分测试中超越竞争对手，但频繁失误和缺乏透明度（未发布系统卡）可能影响其商业化前景。目前xAI正推动300美元/月的订阅服务和企业API应用。

2025年7月11号 10:40

930

智谱上线了类似Manus的PPT生成功能AI Slides，免费使用无限制

智谱推出免费AI PPT生成工具"AI Slides"，基于GLM-Experimental模型，用户只需输入主题或文档即可自动生成结构清晰、排版专业的演示文稿。该功能支持数据可视化呈现，突出关键信息，大幅提升制作效率。目前可在chat.z.ai平台体验，适用于商务汇报和学术展示等多种场景。

2025年7月11号 9:42

3.0k

AI开源&商用产品

AI产品提交

模型库

MCP服务端

MCP客户端

MCP服务调试

案例教程

AI热门资讯

今日AI热点

日本开发人形机器人Alter3：采用GPT-4技术自拍都学会了

AIbase

本文来自AIbase日报

相关AI新闻推荐

马蜂窝“AI路书”全面开放，AI旅行助手再添实用功能

AI日报：智谱上线PPT生成功能AI Slides；可灵 AI 发布可图2.1模型

谷歌DeepMind开源GenAI Processors：一键构建实时AI工作流

Manus AI官网及社交媒体现变动，中国用户或受影响

墨刀AI重磅上线：输入想法30秒生成高保真、可编辑原型

Mistral AI 发布 Devstral2507:为代码中心语言建模而生

5分钟生成专业PPT！智谱AI Slides火爆上线，GLM-Experimental带你体验未来办公

AWS 在 AI 竞争中加码基础设施，SageMaker 平台迎来重大升级

马斯克的新AI聊天机器人Grok 4：是追求真理还是个人观点的代言？

智谱上线了类似Manus的PPT生成功能AI Slides，免费使用无限制

AI开源&商用产品

AI产品提交

模型库

MCP服务端

MCP客户端

MCP服务调试

案例教程

AI热门资讯

今日AI热点

日本开发人形机器人​Alter3：采用GPT-4技术 自拍都学会了

AIbase

本文来自AIbase日报

相关AI新闻推荐

马蜂窝“AI路书”全面开放，AI旅行助手再添实用功能

AI日报：智谱上线PPT生成功能AI Slides；可灵 AI 发布可图2.1模型

谷歌DeepMind开源GenAI Processors：一键构建实时AI工作流

Manus AI官网及社交媒体现变动，中国用户或受影响

墨刀AI重磅上线：输入想法30秒生成高保真、可编辑原型

Mistral AI 发布 Devstral2507:为代码中心语言建模而生

5分钟生成专业PPT！智谱AI Slides火爆上线，GLM-Experimental带你体验未来办公

​AWS 在 AI 竞争中加码基础设施，SageMaker 平台迎来重大升级

马斯克的新AI聊天机器人Grok 4：是追求真理还是个人观点的代言？

智谱上线了类似Manus的PPT生成功能AI Slides，免费使用无限制

日本开发人形机器人Alter3：采用GPT-4技术自拍都学会了

AWS 在 AI 竞争中加码基础设施，SageMaker 平台迎来重大升级