纽约人工智能团队Nous Research,这群以打造“个性化、无限制”语言模型闻名的“技术宅”,最近又搞出了新动作——他们推出了全新的模型推理API。这标志着这家一直以来都显得有些“不羁”的AI机构,开始将自家引以为傲的语言模型,通过程序化的接口,送到更广大的开发者和研究人员手中。

QQ_1741832058993.png

“不设限”的模型

一直以来,Nous Research都以挑战OpenAI和Anthropic等大型AI公司的“束缚”而备受关注。他们的口号听起来就带着一股“自由主义”的味道。现在,他们终于决定将这份“自由”打包成API,让更多人能够体验到。

首批API就搭载了两款明星产品:一个是基于Meta Llama3.1架构的重量级通用模型Hermes3Llama70B,另一个则是他们上个月才发布的,能在标准回复和详细的“思维链”(Chain-of-Thought, CoT)之间灵活切换的推理模型DeepHermes-38B Preview. 这简直就像是给开发者们提供了“豪华套餐”和“经济适用型”两种选择。

不过,想要尝鲜这份“AI快递”可不是直接下单那么简单。Nous Research搞了个先到先得的候补名单系统**。当然,为了安抚排队的用户,他们还贴心地为每个新账户准备了5美元的免费额度

这种操作,一方面是技术上为了应对可能涌现的需求高峰,毕竟和那些拥有“钞能力”的大厂相比,Nous在GPU资源上可能确实“囊中羞涩”。

但另一方面,这种“限量供应”也无疑是一种聪明的营销手段,制造了一种“稀缺感”,让人更加好奇他们葫芦里到底卖的什么药。

有趣的是,这个看起来有点“特立独行”的Nous Research,在API设计上却选择了与OpenAI的API设计模式看齐,包括 completions 和 chat completions 接口。

这对于那些已经熟悉OpenAI接口的开发者来说,简直是无缝衔接,可以轻松将Nous的模型集成到他们的应用中. 这也体现了Nous在坚持自身理念的同时,也展现了务实的商业考量。毕竟,方便用户才是硬道理。

从“免费下载”到“付费部署”的商业进化

仅仅四个月前,Nous Research才刚刚推出了他们的首个用户界面聊天机器人Nous Chat。在此之前,他们一直专注于发布开源模型,供用户在本地部署。

以前用户想要部署这些模型,需要自行下载代码并在本地运行,这无疑是一个耗时、繁琐且可能成本不低的“体力活”。而现在,通过API,开发者们可以直接使用高性能的模型,而无需再为基础设施操心. 这标志着Nous Research从纯粹的开源模式向更加可持续的商业模式迈出了重要一步。

这次API的推出,体现了Nous Research在坚持开源原则的同时,寻求商业化道路的努力. 他们在公开模型权重的同时,通过商业化部署来获取收入。这就像是在走钢丝,既要保证“自由”的灵魂不被束缚,又要让“身体”能够健康地活下去。

这种混合模式显然是为了吸引不同的用户群体:个人开发者和研究人员依然可以免费下载和运行模型,而那些追求可靠性、便捷性和性能优化的企业则可以选择付费使用API。

随着时间的推移,Nous Research表示他们的推理服务还会不断扩展,可能会纳入更多特色模型,比如擅长函数调用的Hermes2Pro,以及他们的Psyche项目. 对于那些基于开源模型进行创新的人工智能初创公司来说,Nous Research的API无疑提供了一个新的选择,打破了现有格局,可能会加剧AI推理领域的竞争,并推动技术的进一步发展。

入口:https://portal.nousresearch.com/login