360智脳チームと北京大学が共同開発した中規模推論モデルTiny-R1-32B-Previewが正式にリリースされました。このモデルは、パラメータ数がわずか5%であるにもかかわらず、Deepseek-R1-671Bのフル性能に迫ることに成功し、小規模モデルが効率的な推論分野において大きな可能性を秘めていることを示しました。このモデルは、数学分野を始めとする複数の重要な分野で特に優れた性能を発揮しています。Tiny-R1-32B-Previewは…
Googleは2025年1月22日、推論モデルGemini 2.0 Flash Thinking の強化版を正式リリースし、Chatbot Arena で首位を奪還しました。今回のアップグレードは主に長文コンテキストの処理能力に焦点を当てており、最大100万トークンの入力をサポートすることで、長文テキスト処理におけるより深い分析能力をユーザーに提供します。Google AI責任者のJeff Dean氏は発表会で、今回の試験的なアップデートはモデルの…
MiniMaxは2025年1月15日、新たなシリーズモデルMiniMax-01のオープンソース化を発表しました。このシリーズには、基本的な大規模言語モデルであるMiniMax-Text-01と、ビジョンマルチモーダル大規模モデルであるMiniMax-VL-01が含まれます。MiniMax-01シリーズはアーキテクチャにおいて大胆な革新を遂げ、線形アテンション機構を大規模に実装した初のモデルです。これにより、従来のTransformerアーキテクチャの限界を打ち破りました。パラメータ数は4560億、単一のアクティブ化は459億に及び、海外のモデルと比較して総合的な性能は匹敵します。