最近,AI 编程工具 Cursor 如火如荼,迅速成为编程界和人工智能领域的焦点。Cursor 是一款基于 VS Code 的代码编辑器,它为 AI 辅助编程带来了众多强大功能,让开发者们兴奋不已。

最近,知名播客主持人 Lex Fridman 与 Cursor 团队的四位创始成员进行了深入对话,聊聊他们的创新历程和未来规划。

Cursor 的故事可以追溯到2020年,那时 OpenAI 发布了一篇关于缩放损失的论文。这篇论文让人们对机器学习的未来充满期待。它提出,如果能获得更多计算资源和数据,模型的表现会越来越好。

这一想法让团队成员们开始畅想:未来的 AI 将如何帮助各个领域的知识工作者提高效率。2022年底,Cursor 团队提前获得了 GPT-IV 的使用权,这让他们意识到,之前的理论预测正在一步步变为现实。这个时刻激发了他们更大的愿景,他们相信所有编程活动都将借助这些强大的模型来完成。

image.png

Cursor 的一大亮点是它独特的代码差异功能。当你在编辑器中修改代码时,模型会用红色和绿色的高亮显示出变化部分,这样用户可以清楚地看到代码的增删。

在自动完成功能的优化中,Cursor 还专门设计了快速的 diff 接口,以便让开发者在需要快速阅读代码时,能够更高效地获取信息。团队经历了多次尝试,最终找到了最佳的用户体验设计,使得代码的建议既直观又不至于分散注意力。

说到 Cursor 的强大,怎么能不提它背后的机器学习技术呢?Cursor 实际上是由多个定制和前沿模型组成的集成体,特别是它的 Tab 和 Apply 功能,都是经过精心微调的成果。

尽管这些模型在生成代码修改建议时表现优秀,但在实际操作中处理大型文件时仍常常出错。为了改善这个问题,Cursor 采取了一个策略:先让模型生成一个粗略的代码修改方案,再用另一个模型将这些修改应用到实际文件中。这样做不仅提高了代码修改的效率,也让模型在生成代码时使用更少的 tokens,从而降低延迟和成本。

在谈到如何提升 Cursor 的处理速度时,团队介绍了一个名为 “投机编辑” 的概念。通过这一技术,模型能够一次处理多个 tokens,而不是逐个生成。传统的方法是用一个小模型来预测代码,再用大模型来验证,但 Cursor 的团队发现,直接将原始代码片段输入模型,往往能得到更快速的反馈。最终,当模型生成的文本与原始代码不一致时,它才会生成新的 tokens 进行更新。