この度、Cursor AIはClaude 3.7 Sonnetを統合し、ユーザーインターフェースをよりシンプルで使いやすいように更新したことを発表しました。さらに、クロスチャット機能も導入され、チャットの要約を自動的に作成し、新しいチャットウィンドウに引き継ぐことで、ユーザーエクスペリエンスを向上させています。

先日、Anthropic社は最新の推論モデルであるClaude 3.7 Sonnetを正式に発表しました。このモデルは革新的な設計理念と大幅に向上したプログラミング能力により、瞬く間に業界の注目を集めています。Claude 3.7 Sonnetの最大の革新は、迅速な回答と深い思考能力を融合させ、人間の脳の思考プロセスを模倣することで、よりスムーズなインタラクションを実現している点です。

実際のアプリケーションでは、ユーザーは標準モードを選択して迅速に回答を得るか、拡張思考モードに切り替えて、モデルが回答する前に自己反省を行うことができます。このモードは、数学、物理学、プログラミングなどの複雑なタスクに特に適しており、より正確で深い解答を提供します。APIを使用することで、ユーザーはモデルの思考予算を最大128Kトークンまで正確に制御でき、速度、コスト、回答の質の最適なバランスを見つけることができます。従来のモデルとは異なり、Claude 3.7 Sonnetは、単なる競争パフォーマンスではなく、実際のビジネスアプリケーションに重点を置いています。

プログラミング分野では、Claude 3.7 Sonnetは特に優れたパフォーマンスを示しています。あるプログラミングテストでは、Sonnetは70.3%の高得点で、OpenAIのo1、o3-mini、DeepSeek R1(49%前後)などの他の有名なモデルを上回りました。この結果は、AnthropicがSonnetを強力なコーディングAIとして位置づけ、複雑なコードベースの処理やフルスタックの更新における開発者のニーズに応えることに重点を置いていることを示しています。

微信截图_20250225082325.png

Claude 3.7 Sonnetは現在、無料版、プロフェッショナル版、チーム版、エンタープライズ版が全面的に利用可能になり、Anthropic API、Amazon Bedrock、Google CloudのVertex AIで使用できます。ただし、無料ユーザーは現在、拡張思考モードを使用できません。価格設定については、Sonnet 3.7は前世代のモデルと変わらず、入力トークン100万個につき3ドル、出力トークン100万個につき15ドル(思考トークンを含む)です。

プログラミング能力の向上に加えて、Claude 3.7 Sonnetは他の分野でも優れた性能を発揮しています。例えば、TAU-benchテストでは、小売業のシナリオで81.2%、航空業界のシナリオで58.4%の精度を達成し、他のモデルを全面的に凌駕しています。さらに、Sonnetは指示理解、推論能力、マルチモーダル処理、コード記述などにおいても優れた性能を示しており、特に拡張思考モードを有効にすると、数学や科学の問題におけるパフォーマンスが飛躍的に向上します。