RWKV 语言模型 简介 RWKV是一种创新的深度学习网络架构,它将Transformer与RNN各自的优点相结合,同时实现高度并行化训练与高效推理,时间复杂度为线性复杂度,在长序列推理场景下具有优于Transformer的性能潜力。 注意事项 本仓库用于存放RWKV-6版本的模型权重 官方仓库:RWKV-LM
评论