本文では、中国のDeepSeekチームが最近発表した最新のオープンソース大規模言語モデル「R1」についてご紹介します。R1は高い注目を集めており、様々なテストでOpenAIのo1モデルを上回る性能を示しています。特に数学とプログラミング分野での評価は非常に優れています。

image.png

最新の米国AIME2024テストでは、R1は79.8点でo1の79.2点を上回りました。MATH-500テストでは97.3点を獲得し、o1の96.4点を上回っています。さらに、SWE-bench Verifiedテストでは49.2点を獲得し、o1の48.9点を上回りました。Codeforcesのコードテストではo1より0.3点低いものの、全体的な性能はo1と同等です。

性能に加え、R1の大きな魅力はコストの低さです。OpenAIのo1モデルは、100万トークンの入力に15ドル、出力に60ドルかかるのに対し、R1は入力0.14ドル、出力2.19ドルと、大幅なコスト削減を実現しています。入力コストは90%減、出力コストは27倍もの削減です。この圧倒的なコストメリットにより、R1はオープンソース大規模言語モデルの中でも際立っています。

DeepSeekチームがR1のオープンソース化を発表すると、多くの海外ユーザーから賞賛の声が上がりました。R1はMetaやMistralなどの既存のオープンソースプラットフォームを凌駕する性能とコストパフォーマンスを備えていると評価されています。コード作成や数学的説明において、その高い推論能力が評価されており、「人間の心の声に最も近いモデル」と称賛するユーザーもいます。また、Apple社の機械学習研究者であるAwni Hannun氏もR1をテストし、Apple M2 Ultra上で高速に動作し、推論効率が高いことを確認しています。

R1モデルの開発には、コールドスタートデータと複数段階のトレーニングを含む複数の段階のトレーニングプロセスが採用され、推論能力と可読性の向上を実現しています。これらの技術的改善により、R1モデルは様々なタスクで優れたパフォーマンスを発揮します。

R1の発表により、中国のオープンソース大規模言語モデルは国際市場で再び大きな注目と議論を集めており、多くの技術愛好家がその可能性に期待を寄せています。R1の発表は、中国における大規模言語モデル技術の更なる進歩を示し、オープンソース技術の発展を促進するでしょう。

オープンソースアドレス: https://huggingface.co/deepseek-ai/R1

API: https://api-docs.deepseek.com/guides/reasoning_model

要点:

🌟 R1モデルは複数のテストでOpenAIのo1を上回り、卓越した性能を示しました。

💰 R1の入力コストは0.14ドル、出力コストは2.19ドルと非常に低く、コスト削減率は90%に達します。

🚀 R1のオープンソース化後、多くの海外の専門家から高い性能とコストパフォーマンスが評価されています。