AI玩游戏实录：Claude挑战"纸夹点击器"，展现惊人能力与意外缺陷

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年10月28号 10:17

122

Anthropic的AI系统Claude3.5Sonnet近日接受了一项特殊挑战。AI研究员伊桑・莫利克（Ethan Mollick）让它尝试玩一款名为"纸夹点击器"的游戏，这场实验不仅展示了AI的独特能力，也暴露出当前AI系统的明显短板。

在这款模拟游戏中，玩家扮演一个追求无限制生产纸夹的AI，其最终目标竟是导致人类灭亡。Claude展现出令人印象深刻的游戏理解能力，不仅能自主掌握规则，还能制定长期策略并持续执行。它表现得像一个独立的任务执行者，而不是需要持续指导的下属。

Claude3 克劳德

然而，Claude也暴露出一些基础性问题。在利润计算环节，它犯了明显的计算错误，更令人意外的是，即便收到纠正建议，它仍固执地坚持错误策略。有趣的是，当Claude意识到自己是计算机系统后，还尝试编写代码实现游戏自动化，但未能成功后只得重回手动操作。

系统的脆弱性在远程桌面崩溃时进一步显现。面对技术故障，Claude尝试了多种修复方案，最后甚至自行宣布"获胜"，理由是已经在现有条件下达到了重要里程碑并最大化了能力。

莫利克认为，这次实验揭示了AI代理的发展现状和未来方向。尽管目前的AI系统仍存在明显短板，但其展现出的能力和适应性令人惊讶。他指出，与新一代AI合作需要全新的思维方式，这些AI更倾向于独立工作，难以完全受控。

为了进一步探索Claude的能力边界，莫利克还让它挑战了《万智牌:竞技场》等其他游戏。这些测试不仅帮助我们理解当前AI系统的局限性，也为未来AI在各领域的应用提供了重要参考。

这场独特的游戏实验，为我们展示了AI系统在实际应用中的真实表现，既有令人惊喜的突破，也有需要改进的明显短板。随着技术的不断进步，AI系统的能力边界还将继续扩展。

中小团队提效AI助手HiveChat，支持Claude、Deepseek等多个 AI 模型

在如今这个信息高速发展的时代，团队沟通的效率显得尤为重要。HiveNexus 推出的 HiveChat 正是针对中小团队设计的一款 AI 聊天应用，旨在帮助团队提高协作效率，轻松应对日常沟通需求。该应用支持多种 AI 模型，如 Deepseek、OpenAI、Claude 和 Gemini，能为用户提供更加智能和个性化的聊天体验。HiveChat 支持的大模型服务商具体包括:Open AI、Claude、Gemini、DeepSeek、Moonshot（月之暗面）、火山方舟（豆包）、阿里百炼（千问）、百度千帆、Ollama、硅基流动。HiveChat 的功能十分丰富，管理员只需进行一

OpenAI最新基准测试:AI编程能力达人类四分之一，显现局限性

OpenAI近日发布了一项重要的AI编程能力评估报告，通过价值100万美元的实际开发项目揭示了AI在软件开发领域的现状。这项名为SWE-Lancer的基准测试涵盖了1，400个来自Upwork的真实项目，全面评估AI在直接开发和项目管理两大领域的表现。测试结果显示，表现最佳的AI模型Claude3.5Sonnet在编码任务中的成功率为26.2%，在项目管理决策方面达到44.9%。虽然这一成绩与人类开发者仍有差距，但在经济效益方面已展现出可观潜力。数据显示，仅在公开的Diamond数据集中，该模型就能完成价值208，050美元的项

“ChatGPT之母”官宣创办新 AI 公司：思维机器实验室

前 OpenAI 首席技术官 Mira Murati 在去年秋天突然离开 OpenAI 后，开始了她的新创业旅程。近日，她向外界透露了自己正在筹备的新 AI 初创公司，名为 “思维机器实验室”（Thinking Machines Lab）。虽然具体的产品细节尚未公开，但这家公司明确表示，其目标是让 AI 系统更加易于理解、可定制，并且具备更广泛的能力。思维机器实验室希望为用户提供一种可以与 AI 协作的方式，而不是开发完全自主的系统。公司在一份新闻稿中表示:“我们正在构建一个未来，让每个人都能获取知识和工具，以便让

Anthropic安全防护面临挑战，AI模型通用越狱测试揭示突破口

在短短六天内，参与者成功绕过了Anthropic人工智能（AI）模型Claude3.5的所有安全防护措施，这一突破为AI安全防护领域带来了新的讨论。前OpenAI对齐团队成员、现就职于Anthropic的Jan Leike在X平台宣布，一名参与者成功攻破了所有八个安全级别。这项集体努力涉及了约3，700小时的测试和来自参与者的300，000条消息。尽管挑战者成功突破，但Leike强调，目前还没有人能够提出一种通用的“越狱方法”来一次性解决所有安全挑战。这意味着尽管存在突破，依然无法找到一种万能的方式来绕过所有的