Arcee AI 今天推出了 SuperNova,这是一个为企业提供部署、具有先进指令遵循能力和完全定制选项的700亿参数语言模型。该模型旨在为企业数据隐私、模型稳定性和定制化方面提供强大、可拥有的替代方案,以应对基于API服务(如 OpenAI 和 Anthropic)的关键问题。

image.png

在由云API主导的AI领域中,Arcee AI 通过 SuperNova 采取了不同的方法。这个大型语言模型(LLM)可以在企业自己的基础设施内部署和定制。SuperNova 今天发布,基于 Meta 的 Llama-3.1-70B-Instruct 架构,并采用了 Arcee 声称的优越的指令遵循能力和适应特定业务需求的新颖后训练过程。

技术创新

SuperNova 的开发涉及多方面的后训练方法

项目首席工程师 Lucas Atkins 透露了秘籍:“我们训练了三个模型,一个是从 Llama405B 蒸馏的精华,一个是用我们的 EvolKit 生成的数据集喂大的,还有一个是在 Llama3instruct 上进行了深度 DPO 的改造。最后,我们用一种新魔法把它们合体,保留了每个模型的超能力。”

Arcee 声称这造就了 SuperNova 的指令遵循能力,特别是从405B 参数模型的蒸馏,这不仅显示了 SuperNova 在保持适中硬件部署的同时,还能捕捉到更大模型的精髓。

企业部署和定制

SuperNova 旨在部署在企业自己的云环境中,首先在 AWS Marketplace 上可用。Arcee 也在努力使其在 Google 和 Azure 市场上可用。

Arcee AI 的联合创始人 Mark McQuade 强调了这种部署方式的好处:“模型部署在你的 AWS VPC 中,但它还会启动一个网络服务器、一个聊天界面和一个数据库来存储你的聊天历史。组织中的每个人都可以和它亲密互动。”

这种部署方式,解决了企业对数据隐私和模型稳定性的担忧。和那些可能会在不通知的情况下改变的基于 API 的服务不同,SuperNova 给了企业完全的控制权。McQuade 指出,鉴于 AI 行业最近的动荡,这一点尤为重要:“OpenAI 刚刚抛弃了3.5……很多公司都围绕3.5的 API 建立了业务。所以那个 API 一变,你的应用程序就挂了。但在我们的世界里,除非你想变,否则什么都不会变,因为这是你的模型,你的方式来运行它。”

定制和持续改进

SuperNova 的一大卖点是它能够在企业环境中进行微调和重新训练。

Atkins 解释了这个过程及其好处:“随着时间的推移,我们可以完全在你自己的环境下重新训练模型,以更好地符合你的偏好。随着我们保存这些聊天,如果你希望模型根据你作为企业的独特偏好全面改进,我们有能力这样做,而不必让数据离开你的系统。”

这种能力让技术团队能够将模型适应特定领域的知识或公司特定的要求。这和那些通常不允许这种程度定制的基于云的 API 服务相比,无疑是一个巨大的优势。

开源组件

虽然完整的70B 模型不是开源的,但 Arcee 正在为开发人员社区发布几个组件:

免费API用于测试和评估: 这允许开发人员在不承诺全面部署的情况下尝试 SuperNova。

SuperNova-Lite: 一个8B 参数的开源版本模型。这个较小的模型对于在资源受限的环境中工作的开发者或那些在部署完整模型之前想要了解架构的开发者可能有用。

EvolKit: 他们的数据集生成管道,用于创建复杂的QA对。这个工具对于希望为其特定用例创建自定义训练数据的组织来说可能很有价值。

通过开源这些组件,Arcee 为更广泛的AI社区做出了贡献,同时也为潜在客户提供了评估和定制其产品的工具。Arcee SuperNova 也在 AWS Marketplace 上可用。

性能声明和基准测试

Arcee 声称 SuperNova 在各个领域表现良好,特别是在数学推理方面。“Atkins 指出:“这个在数学基准测试中非常出色。”然而,公司鼓励第三方评估以验证他们的声明。

“我们将提供一个 API 供人们使用。如果有第三方想要运行可信的基准测试来自己评估,我们可以安排提供给他们访问权重的权限。我们希望对这个模型有完全的透明度。” Atkins 说。

这种对第三方评估的开放性值得称赞,因为它允许独立验证 Arcee 的声明。看到 SuperNova 在标准基准测试中的表现与 OpenAI、Anthropic 等领先 AI 公司模型相比将特别有趣。

image.png

image.png

企业AI战略的影响

SuperNova 的发布正值许多企业正在重新评估其 AI 战略之际。虽然基于云的 API 服务一直主导着这个领域,但对可部署、可定制的模型的兴趣日益增长,这些模型提供了更多的控制和灵活性。

SuperNova 的方法解决了几个关键问题:

  • 数据隐私:通过在公司自己的基础设施内部署,SuperNova 确保敏感数据永远不会离开组织的控制。
  • 模型稳定性:与可能会在不通知的情况下更改或废弃的 API 服务不同,SuperNova 提供了一个稳定的基础,只有在组织选择更新时才会更改。
  • 定制化:能够在公司特定数据上微调和重新训练模型的能力,允许进行大多数 API 服务无法实现的深度定制。
  • 成本控制:虽然初始部署可能需要大量资源,但运行 SuperNova 的长期成本可能低于大规模支付 API 调用的成本。
  • 竞争优势:一个定制的、持续改进的 AI 模型可以在 AI 驱动洞察至关重要的行业中提供显著的竞争优势。

AI主权困境

随着企业在快速发展的 AI 领域中导航,SuperNova 的发布揭示了行业中日益增长的紧张关系:云基础 AI 服务的便利性和能力与可部署模型提供的控制和定制之间的权衡。这种二分法提出了我们可能称之为“人工智能主权困境”。

一方面,像 GPT-4和 Claude 这样的基于云的 API 服务提供了最先进的性能和持续更新,但代价是数据隐私问题和有限的定制化。另一方面,像 SuperNova 这样的模型承诺完全控制和定制,但需要在内部专业知识来部署和维护。

Arcee 通过 SuperNova 采取的方法试图弥合这一差距,提供了一个可以在本地部署的模型,同时仍然提供旨在与领先的基于云的服务相媲美的能力。这种混合方法可能特别吸引那些有严格监管要求的行业或那些处理高度敏感数据的行业。

官方博客:https://blog.arcee.ai/meet-arcee-supernova-our-flagship-70b-model-alternative-to-openai/