GPT-4.5、わずか6時間で人気を失い、xAI Grok-3が逆転勝利

AIbase基地

公開日AIニュース · 1 分で読めます · Mar 4, 2025

OpenAIのGPT-4.5モデルはリリースからわずか6時間でAI競技場を制覇し、全タスク分類で1位を獲得しました。しかし、この栄光は長くは続きませんでした。マスク氏のxAI Grok-3モデルが急速に追い抜き、首位に躍り出ました。

投票データによると、GPT-4.5とGrok-3はそれぞれ3000票以上を獲得し、最終スコアは1412対1411と僅差の勝負となりました。GPT-4.5は多くの項目で優れた成績を収めましたが、Grok-3は「スタイル制御付き」と「困難なプロンプト」のタスクでやや優位に立ち、総合点で逆転を果たしました。

ChatGPT

画像出典：AI生成画像、画像ライセンス提供元Midjourney

この「6時間での逆転劇」に、多くのユーザーは疑問を呈し、これほど急速な変化が妥当かどうかを問いかけています。これについて、業界関係者は、競争ランキングには投票数の閾値があり、同一時間内に3000票に達したモデルのみがランキングに掲載されると説明しています。そのため、リリース間もないこの2つのモデルが同時にこの基準を満たしたのは、偶然の一致だったということです。

注目すべきは、GPT-4.5はリリース当初、いくつかのネガティブな評価に直面しましたが、その高いEQ（感情知能）に対する評価はその後大きく上昇しました。OpenAIのCEOであるサム・アルトマン氏は、GPT-4.5との会話を共有し、ユーザーからモデルの廃止をしないよう要請されたのは初めてだと述べています。

同時に、GPT-4.5は「大規模言語モデル人狼ゲーム」のようなユニークな競技でも優れた成績を収めました。この競技では、各AIモデルが議論、戦略立案、投票を行い、最終的な勝者は脱落したメンバーで構成される陪審員によって決定されます。GPT-4.5は、協力、欺瞞、戦略立案において、人間を超える優れた能力を示しました。

これらの出来事は、AI競争がますます激化し、各モデルがそれぞれの分野で継続的に革新と向上を続けていることを示しています。今後、この知能の戦いを誰が最終的に制するのか、注目に値します。

GPT-4.5 Grok-3 AIモデル人工知能競争市場

この記事はAIbaseデイリーからのものです

【AIデイリー】へようこそ！ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。

—— AIbase デイリーグループによって作成

Adobeの新しいFireflyプラットフォーム、OpenAIとGoogleのAIモデルを採用し、クリエイティブツールをアップグレード

Apr 25, 2025

OpenAIの新GPT-4.1モデル、アライメントの低下に直面

OpenAIは最近、最新AIモデルGPT-4.1を発表し、指示実行における優れた性能を謳っています。しかしながら、複数の独立したテストで、GPT-4.1は信頼性、つまりアライメントの面で、前モデルのGPT-4.0と比べて低下していることが示されました。通常、OpenAIは新モデル発表時に安全評価の結果を含む詳細な技術報告書を公開しますが、今回はその慣例に従わず、GPT-4.1は「最先端」モデルではないと説明しています。

Apr 24, 2025

Claude-3のIQ、人間の平均を初めて上回る　AnthropicがAI知能の新時代をリード

AnthropicのClaude-3モデルがIQテストで画期的な進歩を遂げ、平均スコアが初めて人間の基準値100を上回りました。これはAI開発史上の大きなマイルストーンです。AIbaseの情報によると、Claude-3はノルウェーのMensa IQテストで前世代モデルを上回り、AIの認知能力における著しい飛躍を示しています。コミュニティの分析では、この成果はAnthropicの技術力を反映しているだけでなく、AIの将来の発展に関する幅広い議論を引き起こしています。関連データと予測は既に…

Apr 22, 2025

OpenAIの新型AIモデルo3、幻覚現象が深刻化精度への懸念も

最近、OpenAIは最新のo3およびo4-mini AIモデルを発表しました。これらのモデルは多くの点で最先端の性能を達成していますが、新たなモデルでは「幻覚」問題が改善されるどころか、OpenAIの以前の複数のモデルよりも幻覚現象が深刻化しています。「幻覚」とは、AIモデルが誤って虚偽情報を生成する現象であり、現在のAIにおける最も困難な課題の一つです。従来、各世代の新しいモデルでは幻覚の減少が見られてきましたが、o3およびo4-miniではそれが逆転しています。

Apr 22, 2025

スイスの研究者、AIが生命が存在する可能性のある惑星を発見できることを発表

広大な宇宙、無数の星々、もう一つの青い惑星を探す夢は、まさに大海撈針。しかし今、スイスの研究チームが、この壮大な探求に強力な新たな推進力を与えました。彼らは、鋭い視線を持つ宇宙探偵のような、星間塵を透過し、居住可能な世界が隠れている可能性のある未知の領域を洞察できる人工知能モデルを開発しました。これは単なる技術的ブレークスルーではなく、未来への宝地図のようなものです。天文学と天体物理学の雑誌に掲載された最新の研究で、科学者たちは詳細を説明しています

Apr 21, 2025

讯飛星火X1が大幅アップグレード：AI分野でOpenAIに対抗

4月21日、科大訊飛は、最新アップグレード版の人工知能モデルである訊飛星火X1を発表し、インテリジェント推論とマルチタスク処理の分野で、OpenAIのo1やDeepSeek R1と肩を並べようとしました。国内で算出されたこの深層推論大規模モデルは、数学、プログラミング、論理的推論、テキスト生成、言語理解、知識に関する質疑応答など、さまざまな一般的なタスクで優れた性能を発揮しています。今回のアップグレードでは、より複雑なシナリオのデータを多く取り入れることで、モデルの性能が大幅に向上しました。

Apr 21, 2025

xAIがGrok3Miniを発表：開発者向けの高コスパAIモデル

xAIは最近、新しい言語モデルであるGrok3Miniを発表し、高効率AI技術の進歩をさらに推進しました。Grok3Miniは速度と経済性を重視して設計されており、小型であるにもかかわらず、多くの高価なAIモデルを上回る性能を複数の分野で発揮します。特に数学、プログラミング、科学のベンチマークテストで優れた結果を示しています。Grok3Mini：高性能と低コストの完璧なバランスGrok3Miniは、標準のGrok3を含む6つのバリエーションからなるGrok3シリーズの一部です。

Apr 21, 2025

IntelがオープンソースAI PlaygroundでArc GPUによるローカルAIモデル実行の新体験を提供

Intelは最近、ローカル生成AI用に設計されたAI Playgroundソフトウェアを正式にオープンソースとして公開したと発表しました。これはIntel Arc GPUユーザーに強力なAIモデル実行プラットフォームを提供します。AIbaseが知る限り、AI Playgroundは様々な画像、動画生成モデルと大規模言語モデル（LLMs）をサポートしており、ローカルの計算資源を最適化することで、AIアプリケーションのハードウェアの敷居を大幅に下げています。このプロジェクトはGitHubで公開されており、世界中の開発者やAI愛好家から注目を集めています。

Apr 21, 2025

IntelがAI Playgroundをオープンソース化、Intel Arcグラフィックスカードで様々なAIモデルを使用可能に

Intelは、生成AIソフトウェア「AI Playground」の正式なオープンソース化を発表し、AIコミュニティから大きな注目を集めています。Intel Arc GPUと統合グラフィックスカード向けに最適化されたAIツールであるAI Playgroundは、「AIの中心」として記述されており、ローカルで動作するチャット型大規模言語モデル（LLM）や画像・動画生成機能をサポートしています。今回のオープンソース化は、Intelによる生成AI技術普及に向けた取り組みを示しています。

Apr 21, 2025

AIロボット企業X-ORIGIN-AI、約1億元規模のシリーズAラウンド資金調達を実施感情的なインタラクションAIハードウェア開発を推進

この度、コンシューマー向けAIロボット企業であるX-ORIGIN-AI（玄源科技）は、約1億元規模のPre-Aラウンド資金調達を完了したことを発表しました。本ラウンドは東方富海がリードインベスターとなり、金鼎資本と聯想之星がフォロワーとして参加、仁辰資本が財務アドバイザーを務めました。今回の資金調達により、X-ORIGIN-AIはAIハードウェアと感情的なインタラクション分野における展開を加速し、感情的なAI製品開発におけるブレークスルーを示しました。X-ORIGIN-AIは、従来のAIツールとしての限界を突破し、人間と機械のインタラクションを「ツール化」から「感情化」へとアップグレードすることに取り組んでいます。

Apr 18, 2025

AIニュース

AIデイリー

AIタイムライン

Alハードウェアです

最新事例

画像コレクション

ビデオコレクション

オーディオコレクション

コンテンツコレクション

最新チュートリアル

AIプロダクトランキング

AIトラフィック成長ランキング

AIトラフィック減少ランキング

AI週間ランキング

アメリカ合衆国

中国

インド

ブラジル

画像生成

パーソナルアシスタント

キャラクター生成

ビデオ生成

AIプロジェクトランキング

AIプロジェクト成長ランキング

AI開発者ランキング

AI組織ランキング

Deepseek

TTS

LLM

ChatGPT

概要

GPT-4.5、わずか6時間で人気を失い、xAI Grok-3が逆転勝利

AIbase基地

この記事はAIbaseデイリーからのものです

関連AIニュースの推奨

Adobeの新しいFireflyプラットフォーム、OpenAIとGoogleのAIモデルを採用し、クリエイティブツールをアップグレード

OpenAIの新GPT-4.1モデル、アライメントの低下に直面

Claude-3のIQ、人間の平均を初めて上回る AnthropicがAI知能の新時代をリード

OpenAIの新型AIモデルo3、幻覚現象が深刻化 精度への懸念も

スイスの研究者、AIが生命が存在する可能性のある惑星を発見できることを発表

讯飛星火X1が大幅アップグレード：AI分野でOpenAIに対抗

xAIがGrok3Miniを発表：開発者向けの高コスパAIモデル

IntelがオープンソースAI PlaygroundでArc GPUによるローカルAIモデル実行の新体験を提供

IntelがAI Playgroundをオープンソース化、Intel Arcグラフィックスカードで様々なAIモデルを使用可能に

AIロボット企業X-ORIGIN-AI、約1億元規模のシリーズAラウンド資金調達を実施 感情的なインタラクションAIハードウェア開発を推進

Claude-3のIQ、人間の平均を初めて上回る　AnthropicがAI知能の新時代をリード

OpenAIの新型AIモデルo3、幻覚現象が深刻化精度への懸念も

AIロボット企業X-ORIGIN-AI、約1億元規模のシリーズAラウンド資金調達を実施感情的なインタラクションAIハードウェア開発を推進