AIプログラミングツールCursorがClaude 3.7 Sonnet推論モデルと統合

AIbase基地

公開日AIニュース · 1 分で読めます · Feb 25, 2025

この度、Cursor AIはClaude 3.7 Sonnetを統合し、ユーザーインターフェースをよりシンプルで使いやすいように更新したことを発表しました。さらに、クロスチャット機能も導入され、チャットの要約を自動的に作成し、新しいチャットウィンドウに引き継ぐことで、ユーザーエクスペリエンスを向上させています。

先日、Anthropic社は最新の推論モデルであるClaude 3.7 Sonnetを正式に発表しました。このモデルは革新的な設計理念と大幅に向上したプログラミング能力により、瞬く間に業界の注目を集めています。Claude 3.7 Sonnetの最大の革新は、迅速な回答と深い思考能力を融合させ、人間の脳の思考プロセスを模倣することで、よりスムーズなインタラクションを実現している点です。

実際のアプリケーションでは、ユーザーは標準モードを選択して迅速に回答を得るか、拡張思考モードに切り替えて、モデルが回答する前に自己反省を行うことができます。このモードは、数学、物理学、プログラミングなどの複雑なタスクに特に適しており、より正確で深い解答を提供します。APIを使用することで、ユーザーはモデルの思考予算を最大128Kトークンまで正確に制御でき、速度、コスト、回答の質の最適なバランスを見つけることができます。従来のモデルとは異なり、Claude 3.7 Sonnetは、単なる競争パフォーマンスではなく、実際のビジネスアプリケーションに重点を置いています。

プログラミング分野では、Claude 3.7 Sonnetは特に優れたパフォーマンスを示しています。あるプログラミングテストでは、Sonnetは70.3％の高得点で、OpenAIのo1、o3-mini、DeepSeek R1（49％前後）などの他の有名なモデルを上回りました。この結果は、AnthropicがSonnetを強力なコーディングAIとして位置づけ、複雑なコードベースの処理やフルスタックの更新における開発者のニーズに応えることに重点を置いていることを示しています。

微信截图_20250225082325.png

Claude 3.7 Sonnetは現在、無料版、プロフェッショナル版、チーム版、エンタープライズ版が全面的に利用可能になり、Anthropic API、Amazon Bedrock、Google CloudのVertex AIで使用できます。ただし、無料ユーザーは現在、拡張思考モードを使用できません。価格設定については、Sonnet 3.7は前世代のモデルと変わらず、入力トークン100万個につき3ドル、出力トークン100万個につき15ドル（思考トークンを含む）です。

プログラミング能力の向上に加えて、Claude 3.7 Sonnetは他の分野でも優れた性能を発揮しています。例えば、TAU-benchテストでは、小売業のシナリオで81.2％、航空業界のシナリオで58.4％の精度を達成し、他のモデルを全面的に凌駕しています。さらに、Sonnetは指示理解、推論能力、マルチモーダル処理、コード記述などにおいても優れた性能を示しており、特に拡張思考モードを有効にすると、数学や科学の問題におけるパフォーマンスが飛躍的に向上します。

OpenAIの新システム、生物・化学リスク情報の遮断でAIの安全性を確保

OpenAIは最近、最新のAI推論モデルo3とo4-miniを監視し、生物・化学兵器に関する脅威に関連するプロンプトを阻止することを目的とした新システムを発表しました。このシステムの目標は、モデルが有害な攻撃の実施を唆す可能性のある助言を提供することを防ぎ、AIの安全性を確保することです。OpenAIは、o3とo4-miniは以前のモデルよりも能力が著しく向上しているため、悪意のあるユーザーの手に渡ると新たなリスクをもたらす可能性があると述べています。OpenAIの内部ベンチマークテストによると、o3…

テンセント混元T1正式版とDeepSeek V3-0324が元宝に上线

テンセント混元T1正式版が先週リリースされた後、多くのユーザーが元宝でいつこの新バージョンを使用できるのかを懸念していました。これに対して、テンセントは最新のニュースで、混元T1正式版とDeepSeek V3最新版が同時に上线し、ユーザーに全く新しい体験を提供することを発表しました。混元T1正式版はテンセントが独自開発した深層思考モデルであり、以前のT1Preview版と比較して全面的なアップグレードが実施されています。新バージョンは速度と性能を向上させただけでなく、総合的な効果も大幅に改善され、秒単位の応答を実現しています。

プログラミング能力で圧倒的リード？Claude 3.7 Sonnet、Claude Codeが登場し、OpenAI o3-mini、DeepSeek R1を凌駕！

AnthropicがClaude 3.7 SonnetとClaude Codeを発表しました。Claude 3.7 Sonnetは世界初のハイブリッド推論モデルとして、独自の推論モードと卓越した性能を備えています。一方、Claude Codeは強力なインテリジェントコーディングツールです。これらの発表はAI分野で大きな注目を集め、ユーザーにより効率的でインテリジェントなサービスと開発体験を提供します。Claude 3.7 Sonnetの概要

わずか50ドル以下で訓練！OpenAIのo1に匹敵するAI推論モデルs1が登場

スタンフォード大学とワシントン大学のAI研究者らが、わずか50ドル以下の費用で訓練されたAI推論モデルs1を開発したと発表しました。金曜日に公開されたこの研究成果は、s1が数学とプログラミング能力テストにおいて、OpenAIのo1モデルやDeepSeekのR1モデルに匹敵する性能を示したことを明らかにしています。s1のコードとデータはGitHubで公開されており、他の研究者も利用可能です。研究チームによると、彼らは…

AI推論モデルが数学コンテストで人間を圧倒、プログラミング能力もプログラマーを凌駕！驚異的なAIモデルの数々！

AI技術の急速な発展において、推論モデルはAI技術の重要な担い手として驚異的な速度で進化しています。数学的推論からコード生成、科学計算からマルチモーダル処理まで、次世代AI推論モデルはかつてないほどの強力な能力を見せています。本稿では、トップ5のAI推論モデルを深く掘り下げて解説します。それらは作業効率の向上だけでなく、複数の分野で人間の専門家を凌駕する成果を上げています。AI推論モデル紹介OpenAI o3OpenAI o3モデルはo1に続く次世代推論…

OpenAI CEOアルトマン氏、AGI到来を否定：期待値を下げるべきと発言

先日、OpenAIのCEOであるサム・アルトマン氏は、ソーシャルメディアプラットフォームX上で「OpenAIが汎用人工知能（AGI）を実現した」という説を明確に否定しました。彼は、AGIに関する議論が過熱する一方で、OpenAIは来月AGIを展開する予定はなく、この技術を開発したわけでもない、と述べています。アルトマン氏は、期待値を「100倍」下げるべきだと人々に警告しています。AGI、すなわち汎用人工知能とは、人間の知的能力を要するあらゆるタスクを理解、学習、実行できる人工知能のことです。