你绝对想不到！重复这个简单指令让AI生成代码快100倍

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2025年1月9号 10:45

125

近期，BuzzFeed 的高级数据科学家麦克斯・伍尔夫进行了一项实验，探索通过反复请求 AI 改进代码的效果。实验中，他使用了 Claude3.5语言模型，给出了一个经典的编程挑战:编写 Python 代码，以找出一百万个随机数中，数字之和为30的最大值和最小值之间的差值。

代码互联网 (1)

图源备注：图片由AI生成，图片授权服务商Midjourney

在初始版本中，Claude 生成的代码运行时间为657毫秒。然而，随着伍尔夫不断输入 “写出更好的代码（write better code）” 这一简单指令，最终生成的代码运行时间缩短至仅6毫秒，提升了整整100倍的性能。这一结果不仅令人瞩目，AI 在定义 “更好代码” 的过程中也展现了意想不到的变化。

在第四次请求 “写更好的代码” 时，Claude 意外地将代码转变为类似企业应用程序的结构，添加了一些典型的企业特性，而伍尔夫并未对此提出要求。这表明，AI 可能将 “更好代码” 与 “企业级软件” 联系在了一起，反映了其训练过程中所吸收的知识。

开发者西蒙・威利森对这种迭代改进现象进行了分析，认为语言模型在每次新的请求中都以全新的视角来审视代码。尽管每次请求都包含之前对话的上下文，但 Claude 在分析时如同第一次看到该代码一样，这使得它能够不断改进。

不过，伍尔夫在进行更多具体请求的尝试中发现，虽然这样可以更快地获得更好的结果，但代码中仍然会出现一些需要人类修复的细微错误。因此，他强调，精确的提示工程依然至关重要。尽管简单的后续问题可以初步提高代码质量，但有针对性的提示工程会带来显著的性能提升，尽管风险也会相应增加。

值得注意的是，在这项实验中，Claude 跳过了一些人类开发者认为理所当然的优化步骤，例如去重或先对数字进行排序。此外，提问方式的细微变化也会显著影响 Claude 的输出。

尽管这些性能提升令人印象深刻，伍尔夫依然提醒我们，人工开发者在验证解决方案和故障排除方面仍然不可或缺。他指出，虽然 AI 生成的代码不能直接使用，但其在创意和工具建议方面的能力值得关注。

划重点:
🌟 AI 通过反复指令提升代码性能，原代码运行时间从657毫秒降至6毫秒。
💡 AI 在代码中自动添加企业特性，展现出其对 “更好代码” 的独特理解。
🛠️ 提示工程依然重要，精确的请求可以加速结果生成，但仍需人工开发者进行验证和修复。

腾讯AI实验室与上海交大携手破解o1模型 “过度思考” 难题

近年来，随着大语言模型（LLM）的广泛应用，这些模型在复杂推理和问题解决任务中发挥了重要作用。其中，受 OpenAI 的 o1架构启发的 o1-like 模型以其独特的人类思维、逐步推理的能力脱颖而出。然而，这些模型也存在一个显著的低效问题，即 “过度思考”。所谓过度思考，是指模型在处理一些简单问题时，往往会消耗不必要的计算资源，甚至在推理过程中重复无谓的步骤。例如，在解决 “2+3” 这样简单的算术题时，o1-like 模型可能会生成过于详细的推理，使用的 token 数量远超传统的 LL

国产大模型突破！DeepSeek V3挑战Claude 3.5 Sonnet实测全记录

近期，国产大模型DeepSeek V3在AI竞技场的优异表现引发业界关注。作为唯一闯入前十的开源模型，它不仅超越了o1-mini，在编程、数学等多个领域甚至超过了Claude3.5Sonnet。为验证其实际能力，多方展开了一系列实测对比。在基础理解能力测试中，两个模型展现出不同特点。面对中文脑筋急转弯"小明的妈妈有三个孩子"的问题，DeepSeek V3表现出色，不仅答对还进行了自我验证。但在英文双关语"April Fools Day"的测试中则略显不足，未能理解其中的语言巧思，而Claude3.5Sonnet则轻松应对。逻辑推理测试

AI赛道加速商业化：OpenAI的转型困境与突围之路

一场意外的人事变动，让OpenAI首席产品官Kevin Weil临时登上了旧金山万豪酒店的演讲台。这位曾在Twitter和Instagram创造商业奇迹的硅谷产品大师，如今肩负着OpenAI商业化转型的重任。而就在几天前，公司CTO Mira Murati的突然离职，再次将OpenAI置于风口浪尖。这起高管变动并非偶然。过去一年，OpenAI经历了一波又一波的人才流失，包括CTO、AGI就绪主管以及Sora视频生成模型的联合负责人等重量级人物相继离职。这背后折射出公司内部长期存在的理念之争:是坚持非营利性质的AI实验室初心，还是转向

DeepSeek开源大模型开发者之一罗福莉将加盟小米

据第一财经报道，DeepSeek 开源大模型 DeepSeek-V2的关键开发者罗福莉将加入小米，担任小米 AI 实验室的领导，并负责大模型团队的建设。这一消息引起了广泛关注，尤其是在小米计划加强其在大模型领域的布局之际。图源备注:图片由AI生成，图片授权服务商Midjourney据知情人士透露，小米创始人雷军对公司在 AI 大模型领域的起步较晚表示担忧，因此决定高薪挖角罗福莉。罗福莉的背景相当亮眼，她拥有北京大学计算语言学研究所的硕士学位，并在自然语言处理领域的顶级会议 ACL2019上发表了

AI新闻资讯