4月15日、OpenAIは公式ブログでGPT-4.1シリーズモデルの正式リリースを発表しました。GPT-4.1、GPT-4.1mini、GPT-4.1nanoの3つのサブモデルが含まれています。このシリーズは、プログラミング能力、指示の理解、長文処理において大幅なブレークスルーを実現し、前世代のGPT-4oおよびGPT-4o miniを全面的に凌駕しています。特に、コンテキストウィンドウは100万トークンに拡張され、ナレッジベースは2024年6月まで更新されており、複雑なタスクをより強力にサポートします。
GPT-4.1シリーズは現在、開発者向けにのみAPIインターフェースを介して提供されており、一般ユーザーはChatGPTインターフェースから直接体験することはできません。OpenAIによると、GPT-4.1はプログラミングシーンにおいて、GPT-4oと比較してコード生成速度が40%向上し、ユーザーの検索コストが80%削減され、開発効率とコストが大幅に最適化されています。
パフォーマンス:複数のベンチマークテストで記録を更新
- プログラミング能力:SWE-bench Verifiedテストで、GPT-4.1のスコアは54.6%に達し、GPT-4oと比較して21.4%向上しました。
- 指示遵守:MultiChallengeテストで10.5%向上しました。
- マルチモーダル処理:Video-MMEテストで72.0%という新記録を樹立しました。