最近,Meta 的首席 AI 科学家 Yann LeCun 表示,自机器智能(AMI)能够真正帮助人们的日常生活。Meta 正在努力提升其 Llama 模型的推理能力,希望能与 GPT-4o 等顶尖模型相媲美。
Meta 的副总裁 Manohar Paluri 提到,他们正在探索让 Llama 模型不仅能够 “规划”,还可以实时评估决策并在条件变化时进行调整。这种迭代的方法结合了 “思维链” 的技术,旨在实现能够有效结合感知、推理和规划的自主机器智能。
此外,Paluri 强调,在 “非可验证领域” 的 AI 推理中,模型需要将复杂任务分解成可管理的步骤,以便动态适应。例如,规划一次旅行不仅要订机票,还要处理实时的天气变化,这可能会导致重新规划路线。Meta 最近还推出了 Dualformer 模型,能够在人类认知过程中在快速直觉和缓慢深思之间动态切换,有效解决复杂任务。
关于 Llama 模型的训练,Meta 使用自监督学习(SSL),帮助模型在多个领域学习广泛的数据表示,使其具备灵活性。同时,强化学习与人类反馈(RLHF)则使模型在特定任务上精细化表现。两者的结合使得 Llama 模型在生成高质量的合成数据方面表现突出,特别是在语言特征稀缺的地区。
关于 Llama4的发布,Meta 首席执行官马克・扎克伯格在接受采访时透露,团队已经开始了 Llama4的预训练。他还提到,Meta 正在为 Llama4建立计算集群和数据基础设施,预计将会是一个重大进步。Paluri 幽默地提到,如果问扎克伯格发布时间,他可能会说 “今天”,强调了公司在 AI 开发上的快速进展。
Meta 希望在未来的几个月内继续推出新的 Llama 版本,以便不断提升 AI 能力。通过频繁的更新,开发者们可以期待每次发布都能带来显著的升级。
划重点:
- 🤖 Meta 首席 AI 科学家认为自主机器智能将帮助改善日常生活。
- 🚀 Llama 模型将结合自监督学习与强化学习,提升多领域推理能力。
- 📅 Llama4的预训练已开始,预计将在2025年前后推出。