MambaByte

无标记的选择性状态空间模型

普通产品其他语言模型无标记
曼巴字节是一种无标记的语言模型,直接从原始字节中学习,消除了子词标记化的偏见。它在字节上运行,但会导致序列显著变长,标准的自回归Transformer在这种情况下的扩展性较差。我们在字节序列上自回归训练了曼巴字节,这是Mamba状态空间模型的无标记适应。我们的实验表明,与其他字节级模型相比,曼巴字节具有较高的计算效率。我们还发现,曼巴字节在与最先进的子词Transformer的竞争中表现出色,甚至超越其性能。此外,由于长度的线性扩展,曼巴字节在推理过程中比Transformer具有更快的速度。我们的发现证实了曼巴字节在实现无标记语言建模方面的可行性。
打开网站

MambaByte 最新流量情况

月总访问量

17104189

跳出率

44.67%

平均页面访问数

5.5

平均访问时长

00:05:49

MambaByte 访问量趋势

MambaByte 访问地理位置分布

MambaByte 流量来源

MambaByte 替代品