この度、LMSYSが主催する大規模言語モデルの競技場(Chatbot Arena)の最新ランキングが更新されました。LMSYS Chatbot Arenaランキングにおいて、DeepSeek-V2-0628は総合11位にランクインし、Llama3-70B、Qwen2-72B、Nemotron-4-340B、Gemma2-27Bなどの全てのオープンソースモデルを上回り、世界一のオープンソースモデルの栄誉を獲得しました。
DeepSeek-V2-0628は、0507オープンソースChatバージョンと比較して、コード、数学的推論、指示遵守、ロールプレイング、JSON出力などにおいて能力が大幅に向上しています。
Chatbot Arenaは、世界的に認められた権威ある大規模言語モデルのブラインドテストプラットフォームであり、人工によるブラインドテスト方式を採用することで、評価の公平性を確保しています。今回の評価において、DeepSeek-V2-0628は、難しい問題(Hard Prompt)、コード(Code)、長い質問(Longer Query)、数学(Math)などの項目で、世界レベルの長くて難しい問題解決能力を示し、GPT-4-Turbo-0409やClaude3Opusなどのトップレベルのモデルと同等のレベルにあります。
DeepSeek-V2-0628は国際的な舞台で優れたパフォーマンスを示しただけでなく、国内モデルの評価でも上位にランクインし、国内全モデル中2位を獲得するなど、その強力な競争力を示しました。さらに、DeepSeek-V2-0628は2024年6月28日にAPIとウェブインターフェースサービスを開始しており、非常に競争力のある価格で提供されています。
モデルダウンロードアドレス: https://top.aibase.com/tool/deepseek-v2-chat-0628
要点:
🏆 世界トップレベル: DeepSeek-V2-0628は、世界中のオープンソースモデルの中でトップの座を獲得し、AI分野におけるそのリーダーシップを証明しました。
🔍 問題解決能力: 難しい問題とコードの分野において、DeepSeek-V2-0628は世界レベルの長くて難しい問題解決能力を示しました。
💼 価格競争力: DeepSeek-V2-0628のAPIとウェブインターフェースサービスは、非常に競争力のある価格で提供されています。