MistralがオープンソースのMixtral8x7Bを発表、GPT-3.5を超える性能

站长之家

公開日AIニュース · 1 分で読めます · Dec 12, 2023

124

Mistralは最近、Mixtral8x7Bモデルを発表し、AI業界に大きな反響を呼びました。このモデルは、業界をリードするGPT-3.5やMetaのLlama2ファミリーを凌駕し、オープンソースAI分野に大きな波紋を広げています。Mixtral8x7Bのパフォーマンスは初期ユーザーを驚かせましたが、同時にセキュリティへの懸念も引き起こしています。公開されたMistralのオープンソースモデルMixtral8x7Bは、業界をリードするGPT-3.5やMetaのLlama2を上回る性能を誇ります。

CoreWeaveとOpenAI、119億ドル規模のAIインフラ協定締結　連携強化

GPUクラウドサービス企業のCoreWeaveは先日、OpenAIと5年間の119億ドル規模に及ぶ戦略的パートナーシップ契約を締結したと発表しました。この契約により、CoreWeaveはOpenAIのAIモデルのトレーニングと提供に必要なコンピューティングパワーを提供します。この大規模な取引は、両社の人工知能分野における深い協力関係を示しています。また、この協業の一環として、CoreWeaveはOpenAIに3…

AI市場の大再編：Black Forest Labsが躍進、DALL-Eは80％暴落

人工知能市場はかつてない変革期を迎えています。Poeプラットフォームが最近発表した包括的なレポートによると、2025年初頭、AI分野の競争構造は劇的に変化し、新興企業が急速に老舗企業の市場シェアを侵食しています。100以上のAIモデルを擁するPoeは、過去1年間の何百万ものユーザーのインタラクションデータに基づき、テキスト、画像、動画生成技術の使用パターンに関する独自の視点を与えてくれます。通常厳重に保護されているこれらの使用データは、技術意思決定者にとって貴重な市場洞察を提供します。市場の分散化と新興勢力の台頭...

DeepSeek R2、3月17日リリースか Claude Sonnet 3.7の地位を揺るがす

Xプラットフォームの最新情報によると、DeepSeekの次世代AIモデルDeepSeek R2が3月17日に正式リリースされる可能性があります。このニュースは業界で大きな注目を集めており、AnthropicのClaude Sonnet 3.7などの既存のAI大手にとって強力な挑戦となる可能性があると多くの人が考えています。Xユーザーのtanvitabs氏が本日未明に投稿した投稿によると、DeepSeek R2は、より優れた…を含む複数の重要な分野でブレークスルーを実現したと主張しています。

大規模言語モデルの効率を1.7倍に向上：バイトダンスのCOMET技術がオープンソース化

バイトダンス傘下の豆包大規模言語モデルチームは先日、混合専門家モデル（MoE）アーキテクチャにおける主要なボトルネックを克服し、COMETという名称の重要な最適化技術をオープンソース化したと発表しました。この技術は、大規模言語モデルのトレーニング効率を大幅に向上させ、最大1.7倍の効率向上を実現し、トレーニングコストを40％削減することに成功しました。画像注記：画像はAIによって生成され、画像ライセンス提供サービスMidjourneyを使用しています。COMET技術は、バイトダンスの万規模GPUクラスタトレーニングで実際に適用されており、数百万GPU時間の節約に貢献しています。

AIニュース