Googleは2025年1月22日、Gemini 2.0 Flash Thinking 推論モデルの強化版を正式に発表し、Chatbot Arenaで再び首位を獲得しました。今回のアップデートは主にロングコンテキスト処理能力に重点が置かれ、最大100万トークンの入力をサポートすることで、長文処理におけるより深い分析能力を提供します。

image.png

Google AI責任者のJeff Dean氏は発表会で、今回の実験的アップデートはモデルの信頼性を高め、モデルが生成する思考と最終的な回答の矛盾を減らすことを目的としていると述べました。Gemini 2.0 Flash Thinkingは従来版の長所を受け継ぎつつ、思考(thoughts)に基づいた推論能力強化機能も追加され、優れた性能を発揮しています。

image.png

技術面では、Gemini 2.0 Flash Thinkingは2つの大きなブレークスルーを実現しました。まず、最大100万トークンのロングコンテキストを処理できるようになったことで、複雑な多段階の対話や推論プロセスに不可欠な要素となりました。次に、自己修正能力が著しく向上し、対話の中で一貫性を維持し、以前に蓄積された情報を柔軟に活用できるようになりました。これは、ユーザーがモデルとやり取りする際に、より自然で一貫性のある対話体験ができることを意味します。

image.png

デモンストレーションでは、Jeff Dean氏が物理の問題を解き、その推論プロセスを説明する様子が披露され、非常に印象的でした。さらに、参加者からは、実体験はデモよりもさらに高速だと評価されています。

ロングコンテキスト処理能力に加え、Gemini 2.0 Flash Thinkingは数学能力テスト、科学能力テスト、マルチモーダル推論能力でも顕著な向上を見せており、特に数学分野では54%も成績が向上しました。これらの優れた成果は、このモデルの将来に大きな期待を抱かせます。

image.png

インタラクティブインターフェースにアクセスすると、「Google AI Studio」プラットフォームで、プロンプトの作成、リアルタイムでの対話、アプリケーション開発など、モデルの機能を網羅的に利用できます。現在のインターフェースは機能がやや分散していますが、Googleはモデルの正式リリース後に、より詳細な技術レポートとユーザーガイドを提供し、ユーザーエクスペリエンスの向上を目指しています。

将来展望として、Googleの開発チームは3Dデータの処理能力を積極的に研究しており、継続的な革新への強い信念を示しています。GoogleによるAI分野における次のブレークスルーは間近に迫っており、注目に値します。

試用リンク: https://aistudio.google.com/prompts/new_chat