2016 年的《精灵宝可梦Go》曾被视为最纯真的游戏体验,鼓励玩家漫步社区、结识陌生人。而到了 2024 年,这款游戏却悄然变身为一个惊人的地理空间人工智能训练场。Niantic开发团队近期披露了一个惊人秘密:多年来,数百万玩家在玩游戏的同时,实际上一直在帮助训练一个庞大的地理空间人工智能系统。这个被称为视觉定位系统(VPS)的技术,正在通过玩家的日常游戏行为,帮助AI学习复杂的三维空间信息。最巧妙的是,这个过程几乎是无感知的。就像互联网文本训练ChatGPT一样,玩家在
在人工智能领域,规模越大似乎就意味着能力越强。为了追求更强大的语言模型,各大科技公司都在疯狂堆叠模型参数和训练数据,结果却发现成本也随之水涨船高。难道就没有一种既经济又高效的方法来训练语言模型吗?来自哈佛大学和斯坦福大学的研究人员最近发表了一篇论文,他们发现,模型训练的精度(precision) 就像一把隐藏的钥匙,可以解锁语言模型训练的“成本密码”。什么是模型精度?简单来说,它指的是模型参数和计算过程中使用的数字位数。传统的深度学习模型通常使用
大模型(LLM)如GPT、Llama等在人工智能领域掀起了一场革命,但如何高效地训练这些庞大的模型并使其符合人类价值观仍然是一个难题。强化学习与人类反馈(RLHF)作为一种重要的LLM训练方法,近年来得到广泛应用,但传统的RLHF框架在灵活性、效率和可扩展性方面存在局限性。为解决这些问题,字节跳动豆包大模型团队开源了名为HybridFlow的RLHF框架,为LLM训练带来了新的可能性。RLHF通常包含三个阶段:首先,actor模型根据输入的提示生成文本;然后,critic模型、reference模型和reward模型对生成
最近,开放源代码倡议组织(OSI)发布了一项新定义,明确什么才算是真正的 “开源” 人工智能。这一新标准引起了科技巨头们的关注,尤其是 Meta 的 Llama 模型,因为它并不符合这些规则。OSI 一直是开放源代码软件的行业标准制定者,但在 AI 系统中,有一些传统许可证未能覆盖的元素,比如模型训练数据。根据 OSI 的新定义,任何被认为是真正开放源代码的 AI 系统必须提供三样东西:首先是有关训练 AI 所用数据的详细信息,以便他人能够理解并重现这些结果;其次是用于构建和运行 AI 的