Yi_34B_Chat_2bit

我要开发同款
匿名用户2024年07月31日
25阅读
所属分类ai、llama、Pytorch、34b、yi、llama、2bit
开源地址https://modelscope.cn/models/AI-ModelScope/Yi_34B_Chat_2bit
授权协议apache-2.0

作品详情

You can run it on 11G mem GPU,quantize base QuIP# method, a weights-only quantization method that is able to achieve near fp16 performance using only 2 bits per weight.

url:https://github.com/Cornell-RelaxML/quip-sharp

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论