智譜テクノロジーチームは、32Bと9BシリーズのGLM(General Language Model)モデルのオープンソース化を発表し、新しいインタラクティブエクスペリエンスプラットフォームZ.aiを正式にローンチしました。このシリーズのモデルには、基盤モデル、推論モデル、熟考モデルが含まれ、いずれも緩やかなMITライセンスに従っており、開発者にとって大きな使用と開発の自由度を提供し、商業利用や自由な配布を無料で許可しています。

今回オープンソース化された32B基盤モデルGLM-4-32B-0414は、320億のパラメータを持ち、15Tの高品質データを使用して事前トレーニングされています。特に、豊富な推論型の合成データが組み込まれています。事後トレーニング段階では、拒否サンプリングや強化学習などの技術を通じて、指示遵守、エンジニアリングコード生成、関数呼び出しなどのタスクにおけるパフォーマンスが大幅に向上し、一部のベンチマーク指標は、GPT-4o、DeepSeek-V3-0324(671B)などのより大規模なモデルに匹敵するか、あるいはそれを上回るようになりました。さらに、GLM-4-32B-0414はコード生成能力をさらに向上させ、より複雑な構造の単一ファイルコードを処理および生成できます。Z.aiの会話モードにはプレビュー機能が組み込まれており、生成されたHTMLとSVGを視覚的に確認できるため、ユーザーは生成結果を評価し、反復的な最適化を行うことができます。

微信截图_20250415090652.png

推論モデルGLM-Z1-32B-0414は、GLM-4-32B-0414をベースに、コールドスタートと拡張強化学習戦略を採用し、数学、コード、論理などの重要なタスクに重点的に最適化されたトレーニングが行われています。このモデルは、一部のタスクにおけるパフォーマンスが、671Bパラメータを持つDeepSeek-R1に匹敵するようになり、強力な数理推論能力を示しており、より広範で複雑なタスクの解決をサポートできます。特筆すべきは、GLM-Z1-32B-0414の実測推論速度が200トークン/秒に達し、国内の商用モデルの中で最速であり、価格はDeepSeek-R1の30分の1に過ぎないことです。

9BサイズのGLM-Z1-9B-0414モデルは、上記の一連の技術を採用しており、パラメータ数は少ないものの、数学的推論と一般的なタスクにおいて依然として優れた性能を発揮し、同サイズのオープンソースモデルの中でもトップレベルの性能を達成しています。特にリソースが制限されている環境では、このモデルは効率と効果のバランスをうまく取ることができ、軽量な展開が必要なユーザーに強力な選択肢を提供します。

微信截图_20250415090630.png

熟考モデルGLM-Z1-Rumination-32B-0414は、AGI(Artificial General Intelligence、汎用人工知能)の未来像に対する智譜の次の段階の探求を表しています。一般的な推論モデルとは異なり、熟考モデルは、より多くのステップによる深い思考を通じて、高度にオープンで複雑な問題を解決します。その重要な革新は、深い思考プロセスにおいて検索ツールを統合して複雑なタスクを処理し、多様なルールベースの報酬メカニズムを使用して、エンドツーエンドの強化学習トレーニングをガイドおよび拡張することです。「問題の自主的な提起—情報の検索—分析の構築—タスクの完了」という完全な研究サイクルをサポートするため、研究論文の執筆や複雑な検索タスクにおける能力が大幅に向上しています。

モデルのオープンソース化に加えて、基盤モデルと推論モデルの両方が、智譜MaaSオープンソースプラットフォーム(bigmodel.cn)に同時に公開され、企業と開発者向けにAPIサービスを提供しています。今回公開された基盤モデルは、GLM-4-Air-250414とGLM-4-Flash-250414の2つのバージョンが提供され、後者は完全に無料です。公開された推論モデルは、さまざまなシナリオのニーズを満たす3つのバージョンに分かれており、GLM-Z1-AirX(超高速版)は国内最速の推論モデルを目指しており、推論速度は200トークン/秒に達し、従来の8倍の速度です。GLM-Z1-Air(高コスパ版)の価格はDeepSeek-R1の30分の1であり、高頻度呼び出しのシナリオに適しています。GLM-Z1-Flash(無料版)は無料で使用でき、モデルの使用障壁をさらに下げることを目指しています。

同時に、智譜は新しいドメインZ.aiを立ち上げました。このプラットフォームは、32B基盤モデル、推論モデル、熟考モデルの3種類のGLMモデルを統合しており、智譜の最新のモデルのインタラクティブエクスペリエンスエントリーポイントとして機能します。現在、3つのオープンソースモデルが公開されており、ユーザーはこのプラットフォームでこれらのモデルの強力な機能を無料で体験できます。