データによると、xAIチームのGrok-2とGrok-Miniの2つのモデルがLMSysチャットボットアリーナランキングに正式にランクインしました。Grok-2は2位という好成績を収め、OpenAIのGPT-4o(5月時点)を上回り、最新のGeminiモデルと並んでトップに輝きました。これは6000人以上のコミュニティユーザーによる積極的な投票によって支えられています。

image.png

特筆すべきは、Grok-2が数学問題において特に優れたパフォーマンスを示し、この分野で1位を獲得したこと、そして複雑な指示、プログラミング、指示遵守など、他の多くのタスクでも2位という素晴らしい成績を収めたことです。一方、Grok-2-Miniは5位にランクインし、その実力を示しました。

Grok-2-Miniは速度が大幅に向上し、以前の2倍の速度を実現しました。この飛躍的な進歩は、xAIの推論チームによる推論スタックの全面的な書き直しによるものです。SGLangを活用することで、より効率的なマルチホスト推論と精度の向上が実現しました。同時に、チームは新しい計算と通信のカーネルアルゴリズム、最適化されたバッチ処理スケジューリング、量子化技術を導入し、モデル全体の性能をさらに向上させました。

Grok-2のパフォーマンスに対して、OpenAIのGPT-4oの方が優れていると考える人もいますが、実際には多くのユーザーが、Grok-2がプログラミングと数学のタスクで非常に優れたパフォーマンスを発揮していると述べています。Grok-2シリーズのモデルは今月からベータ版としてリリースされており、ユーザーはXプラットフォームを通じて体験できます。また、このモデルはFLUX.1画像生成モデルを使用した画像作成にも対応しています。

要点:

✨ Grok-2はLMSysチャットボットランキングで2位を獲得し、GPT-4o(5月時点)を上回り、Geminiと並んで2位にランクインしました。

🚀 Grok-2は数学タスクで優れたパフォーマンスを発揮し、1位を獲得しました。また、他の多くのタスクでも上位にランクインしました。

💡 Grok-2-Miniは速度が向上し、以前の2倍の速度になりました。これにより、パフォーマンスがさらに向上しました。