先日、マスク氏とそのチームはライブ配信でGrok3を正式発表し、「地球上で最も賢い人工知能」と宣言しました。マスク氏はさらに、Grok3は数学、科学、プログラミングのベンチマークテストで主要なAIモデルをすべて上回り、SpaceXの火星ミッションの計算への応用を計画しており、今後3年以内にはノーベル賞級のブレイクスルーを達成すると予測しています。

QQ_1739945040608.png

しかし、Grok3の実テストでのパフォーマンスは期待外れでした。発表後、いくつかのメディアがGrok3をテストし、「9.11と9.9、どちらが大きいか?」という定番の問題を提示しました。驚くべきことに、この「最も賢いAI」と謳われたGrok3は正しい答えを出すことができず、ネットユーザーからは「天才は簡単な質問には答えたくない」と揶揄されました。

これに対し、マスク氏はGrok3は現在テスト版であり、この段階では間違いが多いほど良いと述べ、完全版は今後数ヶ月以内にリリースされると発表しました。

公式資料によると、Grok3は大規模モデル競技場Chatbot Arenaで良好な成績を収めていますが、競合他社のDeepSeek R1やGPT-4.0との差はわずか1~2%です。マスク氏は発表会で、Grok3は20万枚以上のH100チップを使用し、総トレーニング時間は2億時間に及んだことを明らかにしました。