匿名用户2024年07月31日
28阅读
所属分类aipytorch
开源地址https://modelscope.cn/models/jingyuyao/qwen_feng

作品详情

Training procedure

The following bitsandbytes quantization config was used during training:

  • quant_method: bitsandbytes
  • loadin8bit: False
  • loadin4bit: True
  • llmint8threshold: 6.0
  • llmint8skip_modules: None
  • llmint8enablefp32cpu_offload: False
  • llmint8hasfp16weight: False
  • bnb4bitquant_type: nf4
  • bnb4bitusedoublequant: True
  • bnb4bitcompute_dtype: bfloat16

Framework versions

  • SWIFT 1.5.3

Base model information

  • BaseModel Class QWenLMHeadModel

model的一些建议

  1. 对于该模型,主要是为了学习和锻炼使用。
  2. 该代码生成模型所使用的数据集为swift框架内部集成的数据集
  3. 改代码的运行过程之中我们可以使用大语言模型进行对话
  4. 本模型能够认知本身的名字和称号,待我再去训练和测试。
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论