ChatRWKV 对标 ChatGPT 的开源项目开源项目

我要开发同款
匿名用户2023年04月12日
262阅读

技术信息

开源地址
https://github.com/BlinkDL/ChatRWKV
授权协议
Apache-2.0

作品详情

ChatRWKV类似于ChatGPT,但由RWKV(100%RNN)语言模型提供支持,并且是开源的。希望做“大规模语言模型的StableDiffusio”。

目前RWKV有大量模型,对应各种场景、各种语言:

Rave模型:适合直接聊天,适合+i指令。有很多种语言的版本,看清楚用哪个。适合聊天、完成任务、写代码。可以作为任务去写文稿、大纲、故事、诗歌等等,但文笔不如testNovel系列模型。Novel-ChEg模型:中英文小说模型,可以用+ge生成世界设定(如果会写prompt,可以控制下文剧情和人物),可以写科幻奇幻。不适合聊天,不适合+i指令。Novel-Ch模型:纯中文网文模型,只能用+ge续写网文(不能生成世界设定等等),但是写网文写得更好(也更小白文,适合写男频女频)。不适合聊天,不适合+i指令。Novel-ChEg-ChPro模型:将ChEg-ChPro在高质量作品微调(名著,科幻,奇幻,古典,翻译,等等)。HuggigFaceGradioDemo(14Bctx8192):https://huggigface.co/spaces/BlikDL/ChatRWKV-gradio

Rave (7B在Alpaca等上微调)Demo:https://huggigface.co/spaces/BlikDL/Rave-RWKV-7B

RWKVpippackage:https://pypi.org/project/rwkv/ 

更新ChatRWKVv2和piprwkv包(0.7.3):

使用v2/covert_model.py将模型转换为策略,以加快加载速度并节省CPU内存。

###NoteRWKV_CUDA_ONwillbuildaCUDAkerel("pipistallija"first).###HowtobuildiLiux:settheseadruv2/chat.pyexportPATH=/usr/local/cuda/bi:$PATHexportLD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH###Howtobuildiwi:IstallVS2022buildtools(https://aka.ms/vs/17/release/vs_BuildTools.exeselectDesktopC++).ReistallCUDA11.7(istallVC++extesios).Ruv2/chat.pyi"x64ativetoolscommadprompt".下载RWKV-4权重: https://huggigface.co/BlikDL(使用RWKV-4模型。勿使用RWKV-4a和RWKV-4b模型。)

RWKVDiscord https://discord.gg/bDSBUMeFpcTwitter: https://twitter.com/BlikDL_AI

RWKVLM: https://github.com/BlikDL/RWKV-LM (解释、微调、训练等)

RWKVi150lies (模型、推理、文本生成): https://github.com/BlikDL/ChatRWKV/blob/mai/RWKV_i_150_lies.py

ChatRWKVv2:具有"stream"和"split"策略,以及INT8。3GVRAM足以运行RWKV14B https://github.com/BlikDL/ChatRWKV/tree/mai/v2

os.eviro["RWKV_JIT_ON"]='1'os.eviro["RWKV_CUDA_ON"]='0'#if'1'theuseCUDAkerelforseqmode(muchfaster)fromrwkv.modelimportRWKV#pipistallrwkvmodel=RWKV(model='/fsx/BlikDL/HF-MODEL/rwkv-4-pile-1b5/RWKV-4-Pile-1B5-20220903-8040',strategy='cudafp16')out,state=model.forward([187,510,1563,310,247],Noe)#use20B_tokeizer.jsoprit(out.detach().cpu().umpy())#getlogitsout,state=model.forward([187,510],Noe)out,state=model.forward([1563],state)#RNNhasstate(usedeepcopyifyouwattocloeit)out,state=model.forward([310,247],state)prit(out.detach().cpu().umpy())#sameresultasabove

https://huggigface.co/BlikDL/rwkv-4-rave/blob/mai/RWKV-4-Rave-14B-v7-Eg-20230404-ctx4096.pth:

功能介绍

ChatRWKV 类似于 ChatGPT,但由 RWKV(100% RNN)语言模型提供支持,并且是开源的。希望做“大规模语言模型的 Stable Diffusion”。 目前 RWKV 有大量...

示例图片

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论