Claude AI模型系列重大更新：Claude 3.5 Haiku上线，AI 性能大幅提升

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年11月5号 11:38

256

Anthropic最近发布了其 Claude AI 模型系列的重大更新，其中包括升级版的 Claude3.5Sonnet 和全新推出的 Claude3.5Haiku。

这次更新不仅在性能方面取得了显著进展，还在成本效率上展现了更强的竞争力。这一发布被视为 AI 行业中的一次重要里程碑，尤其在编程能力和逻辑推理方面的提升引人关注。

新版本的模型在多个性能基准测试中表现卓越，特别是 Claude3.5Haiku 模型在编程任务中的成绩尤为突出。升级后的 Claude3.5Sonnet 模型在软件工程基准验证测试中取得了49.0% 的得分，创下了公共可用模型的新纪录，包括一些专业的编程系统。值得注意的是，新的 Haiku 模型在性能上与 Claude3Opus 不相上下，但运营成本却大幅降低，每百万个输入 token 的费用仅为1美元，输出 token 的费用为5美元，这让组织在实施 AI 时更加灵活高效。

除了在编程能力上的显著提升，Claude 模型在语言理解和逻辑推理方面的表现也有所改善。例如，在评估工具使用能力的 TAU 基准测试中，Sonnet 模型在零售应用领域的得分从62.6% 提高到了69.2%。这些改进表明，AI 领域正在经历一种新的发展模式，高性能的能力不再与高昂的成本相挂钩，这有助于推动 AI 技术的普及。

Anthropic的策略并不局限于开发特定任务的工具，而是着眼于更广泛的应用，赋予 Claude 一定的通用计算机技能。通过推出新的 API，Claude 能够直接操作人类用户所用的标准软件界面，实现鼠标移动、选择元素以及文本输入等功能。这种人机协作的进步为未来的 AI 应用奠定了基础。

此外，此次发布还将对各行业的业务产生深远影响。企业现在可以以更低的成本获得更强大的 AI 能力，促进各行各业的 AI 采纳。尤其是在软件开发领域，升级后的编程能力将极大地提高团队的工作效率。而增强的语言理解能力也将为客户服务和内容生成带来新的机遇。随着这些新功能的普及，预计企业 AI 的应用将加速发展。

划重点:
🌟 Anthropic推出的 Claude3.5Sonnet 和 Haiku 模型在性能和成本效率上取得重大进展。
💻 新的 API 使 Claude 能够直接与计算机界面互动，提升人机协作能力。
🚀 更新将加速各行业对 AI 技术的采用，帮助企业以更低成本实现高效的 AI 应用。

OpenAI最新基准测试:AI编程能力达人类四分之一，显现局限性

OpenAI近日发布了一项重要的AI编程能力评估报告，通过价值100万美元的实际开发项目揭示了AI在软件开发领域的现状。这项名为SWE-Lancer的基准测试涵盖了1，400个来自Upwork的真实项目，全面评估AI在直接开发和项目管理两大领域的表现。测试结果显示，表现最佳的AI模型Claude3.5Sonnet在编码任务中的成功率为26.2%，在项目管理决策方面达到44.9%。虽然这一成绩与人类开发者仍有差距，但在经济效益方面已展现出可观潜力。数据显示，仅在公开的Diamond数据集中，该模型就能完成价值208，050美元的项

Anthropic发布Citations功能，助力开发者获取AI生成答案的来源文献

为了加强其AI模型的透明性和可追溯性，Anthropic于周四宣布推出一项新功能——Citations。该功能旨在帮助开发者在通过Claude AI系列生成的答案中，提供来自源文档的精确引用，包括句子和段落。这一创新功能首次推出后，立即在Anthropic的API和Google的Vertex AI平台上提供支持。Citations功能:提高文档透明度与准确性根据Anthropic的介绍，Citations功能可以自动为开发者提供AI模型生成的答案来源，引用源文档中的确切句子和段落。这一功能尤其适用于文档摘要、问答系统以及客户支持应用程序，能够

字节跳动发布豆包大模型1.5Pro，性能超越GPT-4o与Claude3.5Sonnet

字节跳动正式推出其最新的豆包大模型1.5Pro（Doubao-1.5-pro），这一新模型在多个领域的综合能力上表现出色，成功超越了行业内知名的 GPT-4o 和 Claude3.5Sonnet。该模型的发布标志着字节跳动在人工智能领域又向前迈出了重要一步。豆包1.5Pro 采用了新型的稀疏 MoE（混合专家）架构，使用较小的激活参数进行预训练。这种设计的创新之处在于其可以提供等效于7倍激活参数的 Dense 模型性能，使其在效率上远超行业常规的 MoE 架构，带来了约3倍的效率提升。这样的设计使得豆包大模型在知识、代码

AI编程能力进化！通过不断PUA大模型就能提升代码质量

近年来，人工智能（AI）的编程能力不断发展，但尚未达到完美。最近，BuzzFeed 的资深数据科学家 Max Woolf 通过实验发现，如果对大型语言模型(LLM)不断提供 “写更好代码” 的提示，AI 确实能够生成更优质的代码。这一发现引发了广泛关注，业界著名 AI 科学家们也对此表示了极大的兴趣，强调了迭代和提示词设计的重要性。在 Woolf 的实验中，他利用 Claude3.5Sonnet 这一版本的 AI 模型进行了一系列编程任务。起初，他给模型提出了一个简单的编程问题:如何找出一百万个随机整数中，各位数之