人工智能初创公司HyperWrite的首席执行官Matt Shumer宣布了一个重要的里程碑:他们推出了基于Meta开源Llama3.1-70B Instruct的Reflection70B模型。这款新模型不仅在第三方基准测试中表现卓越,还被誉为“世界上最强大的开源AI模型”。

Shumer在社交网络X上分享了这一消息,并展示了Reflection70B在多个测试中超越Meta Llama系列的图表,其性能甚至可与顶级商业模型相媲美。消息一出,HyperWrite的演示网站访问量激增,团队目前正在寻找更多的GPU资源以满足用户需求。

image.png

Reflection70B的独特之处在于其自我纠错技术。Shumer指出,现有的大型语言模型(LLM)可能会产生错误,但往往缺乏自我修正的能力。Reflection70B通过在生成文本后回顾和评估其准确性,确保提供给用户的答案的可靠性。

该模型引入了几种新的特殊符号,使用户能够以更结构化的方式与模型互动。在推理过程中,模型会在特殊标签内输出其推理过程,从而实现实时错误纠正。在演示网站上,用户可以尝试提问,如“‘Strawberry’这个词中有多少个字母‘r’?”或“9.11和9.9哪个数字更大?”等简单问题,Reflection70B经过一定时间的处理后,能够给出正确答案。

Reflection70B的这一特性使其非常适合需要高精度的任务。它通过将推理过程分解为几个明确的步骤,提高了结果的准确性。现在,Reflection70B已经可以通过AI代码库Hugging Face下载,API接入也将很快通过GPU服务提供商Hyperbolic Labs推出。

此外,HyperWrite正在努力将Reflection70B模型集成到其主要的AI写作助手产品中,预计将于下周发布更强大的版本——Reflection405B。Shumer透露,他们正在不断探索如何将这一技术更好地应用于实际产品中。

Reflection70B的成功也离不开Glaive公司的贡献。Glaive专注于生成特定用例的数据集,极大地加速了模型的训练。Glaive的平台能够迅速生成高质量的合成数据,帮助公司快速且经济地微调模型,解决了AI开发中高质量、任务特定数据可用性的主要瓶颈。

HyperWrite作为一家位于长岛的AI初创公司,自2020年由Shumer和Jason Kuperberg共同创立以来,一直在AI领域积极探索。最初是一款Chrome扩展,后来发展成为能够处理更复杂任务的AI助手,拥有200万用户的庞大基础,并获得了《福布斯》年度“30Under30”榜单的荣誉。

HyperWrite最近一轮融资于2023年3月披露,获得了280万美元的资金,投资者包括Madrona Venture Group。这些资金支持了HyperWrite推出新的AI驱动功能,将网页浏览器变成虚拟助手,可以完成从预订航班到在LinkedIn上寻找求职者等各种任务。

Shumer强调,准确性和安全性始终是HyperWrite的首要任务,尤其是在探索复杂自动化任务时。该平台还在不断通过用户反馈进行监测和改进,以完善其个人助手工具。这种谨慎的做法,正如Reflection70B中嵌入的结构化推理和反思,体现了Shumer对精确和责任感的承诺。

模型下载地址:https://huggingface.co/mattshumer/Reflection-Llama-3.1-70B