RWKV-LM
PublicRWKV(发音为RwaKuv)是一个具有出色大语言模型性能的循环神经网络(RNN),它也可以像GPT Transformer一样直接训练(可并行化)。我们现在处于RWKV-7 "鹅"阶段。因此,它结合了RNN和Transformer的优点——性能卓越、线性时间复杂度、常数空间复杂度(无键值缓存)、快速训练、无限上下文长度以及免费的句子嵌入。
创建时间:2021-08-08T14:05:27
更新时间:2025-04-16T00:52:43
13.5K
Stars
2
Stars Increase