Anthropic今日宣布推出Claude 3.5 Sonnet,这是Claude 3. 5 系列中的首款产品。该模型在多项评估中均优于竞争对手及其前身Claude 3 Opus,同时保持了与中端型号相当的速度和成本,树立了行业新标准。

Claude 3.5 Sonnet现已在Claude.ai和Claude iOS应用上向公众开放,同时通过Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI提供商业服务。该模型每百万输入令牌收费 3 美元,每百万输出令牌收费 15 美元,具有200K令牌的上下文窗口。

image.png

性能大幅提升

Claude 3.5 Sonnet在研究生水平推理、本科生水平知识和编码能力等方面创下新的行业基准。它在理解细微差别、幽默感和复杂指令方面取得显著进步,并能以自然亲和的语气创作高质量内容。

值得注意的是,Claude 3.5 Sonnet的运行速度是Claude 3 Opus的两倍。在内部代理编码评估中,Claude 3.5 Sonnet解决了64%的问题,远超Claude 3 Opus的38%。这使得它特别适合处理复杂任务,如上下文相关的客户支持和多步骤工作流程协调。


image.png

视觉能力显著增强

Claude 3.5 Sonnet在视觉处理方面也取得重大突破,在标准视觉基准测试中超越了Claude 3 Opus。它在解释图表和图形等需要视觉推理的任务中表现尤为出色,还能准确地从不完美图像中转录文本,这对零售、物流和金融服务等行业具有重要意义。

image.png

新功能:Artifacts

Anthropic同时在Claude.ai上推出了Artifacts功能,拓展了用户与Claude的交互方式。用户可以要求Claude生成代码片段、文本文档或网站设计等内容,这些内容会在专用窗口中与对话一起显示,创造了一个动态工作空间。

安全与隐私承诺

尽管Claude 3.5 Sonnet的智能水平有了飞跃,Anthropic表示其仍保持在ASL- 2 安全水平。公司与外部专家合作,包括英国人工智能安全研究所(UK AISI),对模型进行了严格的安全测试。Anthropic强调,除非用户明确允许,否则不会使用用户提交的数据来训练其生成模型。

未来展望

Anthropic计划在今年晚些时候发布Claude 3.5 Haiku和Claude 3.5 Opus,完善Claude 3. 5 系列。公司还在开发新的模式和功能,以支持更多企业用例,包括与企业应用程序集成和个性化记忆功能。

Anthropic邀请用户在产品内直接提交反馈,以帮助改进Claude 3.5 Sonnet并指导未来的开发路线。