先日、Googleは開発者プラットフォームGoogle AI StudioとGeminiアプリで、最新のAI推論モデル「Gemini 2.5」を発表しました。このモデルは「考える」能力を備えており、AI技術の新たな進歩を示しています。Googleはさらに、Gemini 2.5 Pro Experimentalも発表しました。これは、これまでで最も知的なマルチモーダル推論AIモデルと言われています。
Gemini 2.5は、月額20ドルのGemini Advancedサブスクリプションユーザー向けの新しいサービスであり、ユーザーは強力な推論能力を体験できます。
2024年9月にOpenAIが最初のAI推論モデルを発表して以来、Anthropic、DeepSeek、Google、xAIなどの大手テクノロジー企業は、知性レベルで競争するために、それぞれ独自の推論モデルを発表しています。推論技術の応用により、これらのモデルは数学やプログラミングタスクでより優れたパフォーマンスを示し、AIのさらなる発展を促進しています。
Googleは、Gemini 2.5 Proが複数のベンチマークテストで、以前のAIモデルやいくつかの主要な競合他社を上回ったと主張しています。例えば、Aider Polyglotというコード編集評価では、Gemini 2.5 Proは68.6%の高得点を獲得し、OpenAI、Anthropic、DeepSeekのトップAIモデルを上回りました。
一方、ソフトウェア開発能力のテストでは、63.8%というスコアはAnthropicのClaude 3.7 Sonnetの70.3%を下回りましたが、OpenAIのo3-miniやDeepSeekのR1よりは優れていました。
さらに、「人間の最終試験」では、Gemini 2.5 Proは18.8%というスコアを獲得し、多くの競合他社を上回りました。Googleによると、Gemini 2.5 Proは100万トークンのコンテキストウィンドウを搭載しており、AIモデルは約75万語(「指輪物語」シリーズ全体よりも長い)を一度のプロンプトで処理できます。今後、Googleは200万トークンのコンテキストウィンドウを導入し、モデルの能力をさらに向上させる計画です。
注目すべきは、Googleによる推論モデルの探求が今回が初めてではないということです。昨年12月、同社はGeminiの「思考」バージョンを発表しています。しかし明らかに、Gemini 2.5は、現在GoogleがOpenAIのoシリーズモデルに対して最も強力な競合相手です。Gemini 2.5 ProのAPI価格については、Googleはまだ詳細な情報を公開していません。
要点:
🌟 Gemini 2.5とPro版は推論能力を備え、AI技術の新たな進歩を示しています。
🚀 複数のベンチマークテストで、Gemini 2.5 Proは多くの競合他社を上回りました。
📈 200万トークンのコンテキストウィンドウを導入し、AIモデルの処理能力をさらに向上させます。