qwen-14b-ggml

我要开发同款
匿名用户2024年07月31日
20阅读
所属分类aiPytorch
开源地址https://modelscope.cn/models/tiansz/qwen-14b-ggml
授权协议Apache License 2.0

作品详情

Clone with HTTP

 git clone https://www.modelscope.cn/tiansz/qwen-14b-ggml.git

qwen-14b已经展现了不错的性能,目前来说仍然是中文开源模型的”领头羊“,但是它的参数量较大,推理速度久,占用显存多也是令人头疼的问题。为了解决以上问题,可以使用官方发布的qwen.cpp项目来加速模型推理。但不得不吐槽一下qwen.cpp的文档写的太精简,而且qwen-14b转换为ggml模型所需内存太大,应该要改成批次转换。

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论