Training procedure
The following bitsandbytes
quantization config was used during training:
- quant_method: bitsandbytes
- loadin8bit: False
- loadin4bit: True
- llmint8threshold: 6.0
- llmint8skip_modules: None
- llmint8enablefp32cpu_offload: False
- llmint8hasfp16weight: False
- bnb4bitquant_type: nf4
- bnb4bitusedoublequant: True
- bnb4bitcompute_dtype: bfloat16
Framework versions
- SWIFT 1.5.3
Base model information
- BaseModel Class QWenLMHeadModel
model的一些建议
- 对于该模型,主要是为了学习和锻炼使用。
- 该代码生成模型所使用的数据集为swift框架内部集成的数据集
- 改代码的运行过程之中我们可以使用大语言模型进行对话
- 本模型能够认知本身的名字和称号,待我再去训练和测试。
评论