OpenAIのGPT-4.5モデルはリリースからわずか6時間でAI競技場を制覇し、全タスク分類で1位を獲得しました。しかし、この栄光は長くは続きませんでした。マスク氏のxAI Grok-3モデルが急速に追い抜き、首位に躍り出ました。
投票データによると、GPT-4.5とGrok-3はそれぞれ3000票以上を獲得し、最終スコアは1412対1411と僅差の勝負となりました。GPT-4.5は多くの項目で優れた成績を収めましたが、Grok-3は「スタイル制御付き」と「困難なプロンプト」のタスクでやや優位に立ち、総合点で逆転を果たしました。
画像出典:AI生成画像、画像ライセンス提供元Midjourney
この「6時間での逆転劇」に、多くのユーザーは疑問を呈し、これほど急速な変化が妥当かどうかを問いかけています。これについて、業界関係者は、競争ランキングには投票数の閾値があり、同一時間内に3000票に達したモデルのみがランキングに掲載されると説明しています。そのため、リリース間もないこの2つのモデルが同時にこの基準を満たしたのは、偶然の一致だったということです。
注目すべきは、GPT-4.5はリリース当初、いくつかのネガティブな評価に直面しましたが、その高いEQ(感情知能)に対する評価はその後大きく上昇しました。OpenAIのCEOであるサム・アルトマン氏は、GPT-4.5との会話を共有し、ユーザーからモデルの廃止をしないよう要請されたのは初めてだと述べています。
同時に、GPT-4.5は「大規模言語モデル人狼ゲーム」のようなユニークな競技でも優れた成績を収めました。この競技では、各AIモデルが議論、戦略立案、投票を行い、最終的な勝者は脱落したメンバーで構成される陪審員によって決定されます。GPT-4.5は、協力、欺瞞、戦略立案において、人間を超える優れた能力を示しました。
これらの出来事は、AI競争がますます激化し、各モデルがそれぞれの分野で継続的に革新と向上を続けていることを示しています。今後、この知能の戦いを誰が最終的に制するのか、注目に値します。