Yuan2-M32-hf-int4

高效能的混合专家语言模型

普通产品编程混合专家注意力路由器
Yuan2.0-M32是一个具有32个专家的混合专家(MoE)语言模型,其中2个处于活跃状态。引入了新的路由网络——注意力路由器,以提高专家选择的效率,使模型在准确性上比使用传统路由器网络的模型提高了3.8%。Yuan2.0-M32从头开始训练,使用了2000亿个token,其训练计算量仅为同等参数规模密集型模型所需计算量的9.25%。在编码、数学和各种专业领域表现出竞争力,Yuan2.0-M32在总参数40亿中只有3.7亿活跃参数,每个token的前向计算量为7.4 GFLOPS,仅为Llama3-70B需求的1/19。Yuan2.0-M32在MATH和ARC-Challenge基准测试中超越了Llama3-70B,准确率分别达到了55.9%和95.8%。
打开网站

Yuan2-M32-hf-int4 最新流量情况

月总访问量

19075321

跳出率

45.07%

平均页面访问数

5.5

平均访问时长

00:05:32

Yuan2-M32-hf-int4 访问量趋势

Yuan2-M32-hf-int4 访问地理位置分布

Yuan2-M32-hf-int4 流量来源

Yuan2-M32-hf-int4 替代品