DeepSeekオープンソースDeepSeek-V2-Chat-0628モデル　コード、数学推論能力向上

AIbase基地

公開日AIニュース · 1 分で読めます · Jul 19, 2024

679

この度、LMSYSが主催する大規模言語モデルの競技場（Chatbot Arena）の最新ランキングが更新されました。LMSYS Chatbot Arenaランキングにおいて、DeepSeek-V2-0628は総合11位にランクインし、Llama3-70B、Qwen2-72B、Nemotron-4-340B、Gemma2-27Bなどの全てのオープンソースモデルを上回り、世界一のオープンソースモデルの栄誉を獲得しました。

DeepSeek-V2-0628は、0507オープンソースChatバージョンと比較して、コード、数学的推論、指示遵守、ロールプレイング、JSON出力などにおいて能力が大幅に向上しています。

Chatbot Arenaは、世界的に認められた権威ある大規模言語モデルのブラインドテストプラットフォームであり、人工によるブラインドテスト方式を採用することで、評価の公平性を確保しています。今回の評価において、DeepSeek-V2-0628は、難しい問題（Hard Prompt）、コード（Code）、長い質問（Longer Query）、数学（Math）などの項目で、世界レベルの長くて難しい問題解決能力を示し、GPT-4-Turbo-0409やClaude3Opusなどのトップレベルのモデルと同等のレベルにあります。

DeepSeek-V2-0628は国際的な舞台で優れたパフォーマンスを示しただけでなく、国内モデルの評価でも上位にランクインし、国内全モデル中2位を獲得するなど、その強力な競争力を示しました。さらに、DeepSeek-V2-0628は2024年6月28日にAPIとウェブインターフェースサービスを開始しており、非常に競争力のある価格で提供されています。

モデルダウンロードアドレス: https://top.aibase.com/tool/deepseek-v2-chat-0628

要点:

🏆 世界トップレベル: DeepSeek-V2-0628は、世界中のオープンソースモデルの中でトップの座を獲得し、AI分野におけるそのリーダーシップを証明しました。

🔍 問題解決能力: 難しい問題とコードの分野において、DeepSeek-V2-0628は世界レベルの長くて難しい問題解決能力を示しました。

💼 価格競争力: DeepSeek-V2-0628のAPIとウェブインターフェースサービスは、非常に競争力のある価格で提供されています。

AI音楽生成モデルMusiConGen：Transformerを用いた音楽生成、リズムとコードの精密制御

MusiConGenモデルは、事前学習済みのMusicGen-melodyフレームワークを微調整したもので、様々なスタイルの音楽片段の生成に使用されます。研究チームは、コードとリズムの制御パラメータを設定することで、生成された音楽サンプルを提示しており、リラックスしたブルース、スムーズなアシッドジャズ、クラシックロック、ハイエナジーファンク、ヘヴィメタルの5つの異なるスタイルを含んでいます。

マスクのxAI、来月Grok 2発表、Grok 3は12月発表予定

イーロン・マスクは、xAIが来月、GPT-4と同等の性能を持つAIモデルGrok 2を発表し、12月にはさらに強力なGrok 3を発表する予定であると発表しました。Grok 3はメンフィスデータセンターで15,000個以上のGPUを用いた大規模なトレーニングが行われています。一部のテスラビデオデータはまだモデルのトレーニングに利用されていませんが、ChatGPTとの比較ではGrokはまだいくつかの点で劣っていることが示されています。Xの買収という文脈においては、キャッチアップには時間が必要です。

小紅書、世界初の「AIコンビニ」を開設 AI関連の優れた投稿に3万～50万PVの支援

小紅書は先日、「科技薯」アカウントを立ち上げ、世界初のAIコンビニ創業プロジェクトを開始しました。全網の優れたクリエイターやテクノロジー企業と協力し、AIの最先端技術、有益な情報、感情的な体験などを提供するコンテンツを配信します。このコンビニでは、@趙純想氏などのクリエイティブなAI製品、例えば食事補助、AI式ラーメンレシピ、AIによる頸椎病治療、林亦LYi氏の家伝のAI治療、AIによる母親の未完成の仕事の完了支援などが販売されています。「科技薯」はまた、イベントを開催し、#AIコンビニを使用してAI関連の投稿を作成した投稿者に3万〜50万PVの支援を提供します。

AI界に衝撃！Llama 3.1リーク：4050億パラメーターのオープンソース巨獣襲来！

最近、4050億パラメーターを持つオープンソースの大規模言語モデルLlama 3.1がRedditでリークされ、大きな注目を集めています。現在、GPT-4に最も近いオープンソース製品と見なされており、一部の性能ではGPT-4を上回るとさえ言われています。Meta（旧Facebook）によってリリースされたこのモデルは、ベースモデルと70Bバージョンのベンチマーク結果を含んでおり、複数の性能テストでGPT-4を上回っています。Llama 3.1は、多言語サポート能力と広範なトレーニングデータセット（15Tトークン以上）を備えています。

AIニュース