元象がMoEオープンソース大規模言語モデルXVERSE-MoE-A36Bを発表、活性化パラメーターは36Bに達する

AIbase基地

公開日AIニュース · 1 分で読めます · Sep 13, 2024

115

深圳元象情報科技有限公司は先日、中国最大級のMixture of Experts（MoE）オープンソース大規模言語モデル「XVERSE-MoE-A36B」の公開を発表しました。このモデルの公開は、中国におけるAI分野における大きな進歩を示し、国産オープンソース技術を国際的なトップレベルに引き上げました。

XVERSE-MoE-A36Bモデルは、総パラメータ数2550億、活性化パラメータ数360億を誇り、1000億を超えるパラメータを持つ大規模モデルに匹敵する性能を実現し、飛躍的な性能向上を達成しました。トレーニング時間は30％削減され、推論性能は100％向上し、トークンあたりのコストを大幅に削減することで、AIアプリケーションの低コスト展開を可能にしました。

微信截图_20240913110614.png

元象XVERSEの「高性能フルパッケージ」シリーズモデルは、既に全面的にオープンソース化され、商業利用も無償で許可されています。これにより、多くの中小企業、研究者、開発者にとって、より多くの選択肢が提供されます。MoEアーキテクチャは、複数の専門分野の専門家モデルを組み合わせることで、従来のスケーリング則の限界を打破し、モデル規模を拡大しながら、モデル性能を最大化し、トレーニングと推論の計算コストを削減します。

複数の権威ある評価において、元象MoEは、国内の千億パラメータMoEモデルSkywork-MoE、従来のMoEのトップランナーであるMixtral-8x22B、そして3140億パラメータのMoEオープンソースモデルGrok-1-A86Bなど、複数の同種モデルを大幅に上回る成果を示しました。

大規模言語モデルの無料ダウンロード

Hugging Face:https://huggingface.co/xverse/XVERSE-MoE-A36B
魔搭:https://modelscope.cn/models/xverse/XVERSE-MoE-A36B
Github:https://github.com/xverse-ai/XVERSE-MoE-A36B
お問い合わせ:opensource@xverse.cn
公式サイト:chat.xverse.cn

大規模言語モデルの効率を1.7倍に向上：バイトダンスのCOMET技術がオープンソース化

バイトダンス傘下の豆包大規模言語モデルチームは先日、混合専門家モデル（MoE）アーキテクチャにおける主要なボトルネックを克服し、COMETという名称の重要な最適化技術をオープンソース化したと発表しました。この技術は、大規模言語モデルのトレーニング効率を大幅に向上させ、最大1.7倍の効率向上を実現し、トレーニングコストを40％削減することに成功しました。画像注記：画像はAIによって生成され、画像ライセンス提供サービスMidjourneyを使用しています。COMET技術は、バイトダンスの万規模GPUクラスタトレーニングで実際に適用されており、数百万GPU時間の節約に貢献しています。

科大訊飛とファーウェイ、AIアプリケーション能力を全面的に向上させた新型星火一体機を発表

科大訊飛とファーウェイは先日、大幅にアップグレードされた新型星火一体機を発表しました。このマシンは、コンピューティングパワー、モデル、トレーニング、推論において包括的な中国語対応を実現し、迅速な展開とすぐに使えるアプリケーション体験を目指しています。今回発表された星火一体機には、4Uトレーニング/推論一体型マシンと2U推論一体型マシンの2種類があり、人工知能が様々な分野での応用において新たな重要な進歩を遂げたことを示しています。新型星火一体機最大の特長は、訊飛星火とDeepSeekの両エンジンを統合している点です。深い考察と業界理解を組み合わせることで実現しました。

AIニュース

元象がMoEオープンソース大規模言語モデルXVERSE-MoE-A36Bを発表、活性化パラメーターは36Bに達する

AIbase基地

関連AIニュースの推奨

大規模言語モデルの効率を1.7倍に向上：バイトダンスのCOMET技術がオープンソース化

火山引擎、大規模言語モデルアプリケーションのオープンソースを発表：大規模言語モデルアプリケーションラボの立ち上げにより、AIイノベーションの可能性を解き放つ

科大訊飛とファーウェイ、AIアプリケーション能力を全面的に向上させた新型星火一体機を発表

李開復：AI時代、すべてのアプリが人間より賢くなる