性能超越GPT-4o 和 Claude 3.5 Sonnet！超强的Reflection 70B 模型登场

人工智能初创公司HyperWrite的首席执行官Matt Shumer宣布了一个重要的里程碑:他们推出了基于Meta开源Llama3.1-70B Instruct的Reflection70B模型。这款新模型不仅在第三方基准测试中表现卓越，还被誉为“世界上最强大的开源AI模型”。

Shumer在社交网络X上分享了这一消息，并展示了Reflection70B在多个测试中超越Meta Llama系列的图表，其性能甚至可与顶级商业模型相媲美。消息一出，HyperWrite的演示网站访问量激增，团队目前正在寻找更多的GPU资源以满足用户需求。

Reflection70B的独特之处在于其自我纠错技术。Shumer指出，现有的大型语言模型（LLM）可能会产生错误，但往往缺乏自我修正的能力。Reflection70B通过在生成文本后回顾和评估其准确性，确保提供给用户的答案的可靠性。

该模型引入了几种新的特殊符号，使用户能够以更结构化的方式与模型互动。在推理过程中，模型会在特殊标签内输出其推理过程，从而实现实时错误纠正。在演示网站上，用户可以尝试提问，如“‘Strawberry’这个词中有多少个字母‘r’?”或“9.11和9.9哪个数字更大?”等简单问题，Reflection70B经过一定时间的处理后，能够给出正确答案。

Reflection70B的这一特性使其非常适合需要高精度的任务。它通过将推理过程分解为几个明确的步骤，提高了结果的准确性。现在，Reflection70B已经可以通过AI代码库Hugging Face下载，API接入也将很快通过GPU服务提供商Hyperbolic Labs推出。

此外，HyperWrite正在努力将Reflection70B模型集成到其主要的AI写作助手产品中，预计将于下周发布更强大的版本——Reflection405B。Shumer透露，他们正在不断探索如何将这一技术更好地应用于实际产品中。

Reflection70B的成功也离不开Glaive公司的贡献。Glaive专注于生成特定用例的数据集，极大地加速了模型的训练。Glaive的平台能够迅速生成高质量的合成数据，帮助公司快速且经济地微调模型，解决了AI开发中高质量、任务特定数据可用性的主要瓶颈。

HyperWrite作为一家位于长岛的AI初创公司，自2020年由Shumer和Jason Kuperberg共同创立以来，一直在AI领域积极探索。最初是一款Chrome扩展，后来发展成为能够处理更复杂任务的AI助手，拥有200万用户的庞大基础，并获得了《福布斯》年度“30Under30”榜单的荣誉。

HyperWrite最近一轮融资于2023年3月披露，获得了280万美元的资金，投资者包括Madrona Venture Group。这些资金支持了HyperWrite推出新的AI驱动功能，将网页浏览器变成虚拟助手，可以完成从预订航班到在LinkedIn上寻找求职者等各种任务。

Shumer强调，准确性和安全性始终是HyperWrite的首要任务，尤其是在探索复杂自动化任务时。该平台还在不断通过用户反馈进行监测和改进，以完善其个人助手工具。这种谨慎的做法，正如Reflection70B中嵌入的结构化推理和反思，体现了Shumer对精确和责任感的承诺。

模型下载地址：https://huggingface.co/mattshumer/Reflection-Llama-3.1-70B

AI新闻资讯

性能超越GPT-4o 和 Claude 3.5 Sonnet！超强的Reflection 70B 模型登场

AIbase基地