杠精大模型_开源AI项目-程序员客栈

项目介绍

GangLLM项目是一个专门与用户抬杠的大模型，它的名字叫“钢蛋儿”，它可以根据用户的输入会进行杠精式的回复，该模型能够捕捉到用户言辞中的细微漏洞，并据此展开犀利的反驳，该模型在开源大模型上微调而来，基础模型采用的InternLLM-Chat-7B模型，采用1680条杠精式对话数据，外加100条自我认知数据进行的微调训练。
特别注意，心脏不好或者有心理疾病者慎用，因使用本模型后产生的心理或生理问题，本人概不负责。
欢迎大家star~⭐⭐

效果演示

B站效果视频：https://www.bilibili.com/video/BV1Xi42127aV/

模型文件

https://openxlab.org.cn/models/detail/cat_boss/GangLLM

微调指南

环境要求

显卡：A100 40G ，硬盘：100G ，内存：32G以上
操作系统：Ubuntu
软件环境：Anaconda、 CUDA/CUDNN
基础模型：InternLM27Bchat
训练框架：XTunter

环境安装

安装依赖

python -m pip install --upgrade pip
pip install modelscope==1.9.5
pip install transformers==4.35.2
pip install streamlit==1.24.0
pip install sentencepiece==0.1.99
pip install accelerate==0.24.1

安装XTunter

  cd  GangLLM/xtuner
  pip install -e '.[all]'

模型微调

微调算法：QLoRA
加速方式：deepspeed_zero2
微调命令：xtuner train internlmchat7bqloraself.py --deepspeed deepspeed_zero2, 详见xtuner命令

杠精大模型

作品详情

项目介绍

效果演示

模型文件

更多资讯

微调指南

环境要求

环境安装

模型微调

重点城市程序员兼职推荐

重点岗位程序员兼职推荐