Skywork-MoE-Base-FP8

146亿参数的高性能MoE模型

普通产品编程MoE大规模模型
Skywork-MoE是一个具有146亿参数的高性能混合专家(MoE)模型,拥有16个专家和22亿激活参数。该模型从Skywork-13B模型的密集型检查点初始化而来。引入了两种创新技术:门控逻辑归一化,增强专家多样化;自适应辅助损失系数,允许层特定的辅助损失系数调整。Skywork-MoE在各种流行基准测试中,如C-Eval、MMLU、CMMLU、GSM8K、MATH和HumanEval,展现出与参数更多或激活参数更多的模型相当的或更优越的性能。
打开网站

Skywork-MoE-Base-FP8 最新流量情况

月总访问量

17104189

跳出率

44.67%

平均页面访问数

5.5

平均访问时长

00:05:49

Skywork-MoE-Base-FP8 访问量趋势

Skywork-MoE-Base-FP8 访问地理位置分布

Skywork-MoE-Base-FP8 流量来源

Skywork-MoE-Base-FP8 替代品