先日、世界中の数千万人のユーザーによるブラインドテスト投票で選ばれたAIモデルランキングが発表され、国産AIモデル「Yi-Lightning」が躍進し、これまで首位を長く占めていたGPT-4を上回りました。
「Yi-Lightning」モデルは、国内有数のAI企業である零一万物によって開発され、複数の部門ランキングで上位にランクインしており、数学部門では国際的な大手企業と並んで3位に位置しています。
注目すべきは、「Yi-Lightning」のスコアが、イーロン・マスクが最近発表したxAIモデルGrok-2-08-13とほぼ同等であり、GPT-4o-2024-05-13、GPT-4o-mini-2024-07-18、Claude3.5Sonnetなどの他の競合他社を大きく引き離している点です。
今回のランキング選考基準は大幅に変更され、回答の長さやスタイルだけでなく、AIモデルが現実の問題を解決する能力に重点が置かれるようになりました。
新しい基準の下でも、「Yi-Lightning」はGPT-4とGrok-2と同等のレベルにあり、その強力な能力を示しています。
翻訳は、AIモデルの応用分野の中でも重要な分野であり、言語理解、生成、クロスリンガルトーク、コンテキストの把握などの能力を総合的に検証します。Qwen2.5-72b-Instruct、DeepSeek-V2.5、Doubao-proなどのモデルとの比較を通じて、Yi-Lightningは翻訳タスクにおいて卓越した性能を示しました。処理速度が速いだけでなく、翻訳結果もより文学的なニュアンスがあり、中国語の表現習慣に沿っています。
例えば、ノートルダム大聖堂に関する英文の一節をランダムに選択しましたが、「Yi-Lightning」は翻訳速度が速いだけでなく、翻訳結果も中国語の文脈により適しています。
Yi-Lightningモデルの技術革新も驚異的です。混合専門家モデルアーキテクチャを採用し、混合注意機構を最適化することで、長系列データの処理における推論コストを大幅に削減しました。さらに、クロスレイヤー注意機構を導入することで、異なる階層間の情報共有をより効率的に行っています。
さらに興味深いのは、Yi-Lightningがタスクの難易度に応じて最適な専門家ネットワークの組み合わせを動的に選択できることです。トレーニング段階ではすべての専門家ネットワークが活性化されますが、推論段階では、具体的なタスクに応じて関連する専門家を択一的に活性化し、あらゆる課題に柔軟に対応できるようにしています。
「Yi-Lightning」モデルは、混合専門家モデルアーキテクチャと最適化された混合注意機構を採用することで、長系列データを効率的に処理し、クロスレイヤー注意機構を通じて異なる階層の情報共有を効率的に行います。
さらに驚くべきことに、「Yi-Lightning」はタスクの難易度に応じて最適な専門家ネットワークの組み合わせを動的に選択し、あらゆる課題に臨機応変に対応できます。
零一万物創業者兼CEOの李開復博士は、「Yi-Lightning」モデルは事前学習段階で様々な戦略を採用することで、モデルが高速であるだけでなく、より豊富な知識を学習できるようにしている、と述べています。
同時に、「Yi-Lightning」の価格戦略も非常に競争力があり、100万トークンあたりわずか0.99元と、コストパフォーマンスに優れています。李開復博士はまた、「Lightning」の優れたパフォーマンスにより、国産AIと国際的なトップレベルの大規模モデルとの差が5ヶ月に短縮されたと指摘し、これは技術の進歩だけでなく、国内AI業界への信頼の表れでもあると述べています。
参考:https://x.com/lmarena_ai/status/1846245604890116457