中国の大手私募ファンドである幻方量化傘下のDeepSeekは、近日、最新の推論特化型大規模言語モデル「R1-Lite-Preview」を発表しました。このモデルは現在、DeepSeek Chatというウェブチャットボットプラットフォームを通じてのみ一般公開されています。
DeepSeekはオープンソースAIエコシステムにおける革新的な貢献で知られており、今回の発表は、高いレベルの推論能力を一般に提供すると同時に、アクセシビリティと透明性へのコミットメントを維持することを目的としています。R1-Lite-Previewは現在チャットアプリでのみ利用可能ですが、OpenAIが最近発表したo1-previewモデルに匹敵、あるいは凌駕する性能で注目を集めています。
R1-Lite-Previewは「連鎖思考」推論を採用しており、ユーザーの問い合わせに応答する際に経験する様々な思考プロセスを示すことができます。
一部の思考チェーンは人間には無意味または間違って見えるかもしれませんが、全体としてR1-Lite-Previewの回答は非常に正確で、GPT-4oやClaudeシリーズなどの従来の強力なAIモデルが抱える「トラップ」問題(例:「イチゴ」という言葉にはいくつの文字「r」が含まれていますか?「9.11と9.9のどちらが大きいか?」など)を解決することができます。
DeepSeekによると、このモデルは論理的推論、数学的思考、リアルタイムの問題解決を必要とするタスクで優れた性能を発揮します。その性能は、AIME(アメリカ数学インビテーショナル)やMATHなどの確立されたベンチマークテストで、OpenAIのo1-previewを上回っています。
さらに、DeepSeekはモデルの拡張データも公開し、問題解決に多くの時間または「思考トークン」を与えることで、その正確性が着実に向上する傾向を示しています。グラフは、思考の深さが増すにつれて、AIMEなどのベンチマークにおけるモデルのスコアが向上することを強調しています。
現在、R1-Lite-Previewは主要なベンチマークで優れた性能を示しており、複雑な数学から論理的なシナリオまで、様々なタスクを処理でき、GPQAやCodeforcesなどのトップレベルの推論モデルと同等のスコアを達成しています。このモデルの透明な推論プロセスにより、ユーザーは論理的なステップをリアルタイムで観察することができ、システムの責任感と信頼性を高めています。
注目すべき点として、DeepSeekはまだ第三者による独立した分析やベンチマークテストのための完全なコードを公開しておらず、独立したテストのためのAPIインターフェースも提供していません。同社はR1-Lite-Previewのトレーニングや構成に関するブログ記事や技術文書も公開しておらず、その背後にある起源は依然として謎に包まれています。
R1-Lite-Previewは現在、DeepSeek Chat(chat.deepseek.com)で無料で利用できますが、高度な「深思」モードは1日50件のメッセージに制限されており、ユーザーはこの機能でその強力な能力を体験できます。DeepSeekは、R1シリーズモデルのオープンソース版と関連APIを公開し、オープンソースAIコミュニティの発展をさらに支援する予定です。
DeepSeekはオープンソースAI分野におけるイノベーションを推進し続けており、R1-Lite-Previewの発表は、推論と拡張性において新たな次元を加えるものです。企業や研究者が推論集約型AIの応用を探求するにつれて、DeepSeekのオープンなコミットメントは、そのモデルが発展とイノベーションの重要なリソースとなることを保証します。
公式入口:https://www.deepseek.com/
要点:
🌟 DeepSeekがR1-Lite-Previewモデルを発表、OpenAIのo1に匹敵、あるいは凌駕する性能。
📊 モデルは透明な推論プロセスを示し、ユーザーは論理的なステップをリアルタイムで観察できる。
🔍 深層学習と論理推論能力が顕著で、将来的にはオープンソース版とAPIが公開される予定。