近日,随着一起关于人工智能版权的案件 ——Kadrey 诉 Meta 案的进展,Meta 公司内部的消息被法庭解封,透露出公司高管在开发 Llama3过程中,执着于超越 OpenAI 的 GPT-4模型。Meta 的生成 AI 副总裁阿赫马德・阿尔 - 达赫(Ahmad Al-Dahle)在2023年10月的一条信息中提到:“老实说,我们的目标必须是 GPT-4。我们有64000个 GPU!我们需要学习如何建设前沿技术,赢得这场竞争。”尽管 Meta 发布开放的 AI 模型,但公司的 AI 领导层显然更关注那些不公开模型权重的竞争对手,比如 Anthropic 和 OpenAI,并将它们的
在推动人工智能(AI)领域透明度的进程中,计算机与通信行业协会(CCIA)于布鲁塞尔和华盛顿共同宣布推出一项开创性的新举措,即全球行业透明度报告模板。这一模板旨在提升公众对通用人工智能(GPAI)模型训练数据的信任与理解。此次发布的 “AI 模型训练数据透明度模板” 要求企业披露用于训练特定 GPAI 模型的数据类型,例如播客、书籍等,同时还需明确数据的主要来源,如开放存取档案、大型公共数据集或公共网站的爬取数据。此外,企业还需详细解释这些数据是如何被筛选和应用于
近日,加州大学伯克利分校的 Sky Computing Lab 团队发布了 Sky-T1-32B-Preview,这是一款开放源代码的推理型人工智能模型,标志着推理型 AI 的研发变得更加容易和便宜。该模型在多个关键基准测试中表现出色,甚至与 OpenAI 早期版本的 o1相媲美。Sky-T1的训练成本令人瞩目,仅为450美元,这意味着高水平推理能力的复制已变得更加可负担且高效。虽然450美元的费用可能听起来不算低,但与几年前动辄数百万美元的训练成本相比,已是巨大的下降。借助合成训练数据,即由其他模型生成的训练数据
加州大学伯克利分校天空计算实验室的研究团队NovaSky于周五发布了Sky-T1-32B-Preview推理模型,这一模型在多个关键基准测试中表现优异,与OpenAI的o1早期版本相媲美,更令人瞩目的是其极低的训练成本。Sky-T1-32B-Preview是首个真正的开源推理模型,NovaSky团队不仅发布了模型,还公开了用于训练它的数据集及必要的训练代码,这意味着该模型可从头开始复制。据团队在博客文章中所述,“Sky-T1-32B-Preview的训练成本不到450美元,这表明可以经济高效地复制高级推理能力。”在不久前,训练同等性能