Llama3-Chinese-pro-8.4B-sft-1M

我要开发同款
匿名用户2024年07月31日
45阅读
所属分类ai、llama、Pytorch
开源地址https://modelscope.cn/models/linjh1118/Llama3-Chinese-pro-8.4B-sft-1M

作品详情

Llama3-Chinese-ORPO

基于Llama3,通过进一步CPT,SFT,ORPO得到的中文版Llama3

=log: 2024/04/21 12:00=: 本仓库是出于 学习目的 而进行的一个实践项目。

News

[2024/04/22] We release the first version of Llama3-Chinese-ORPO.

模型列表

模型名称 模型简介 ModelScope下载链接 Huggingface下载链接
Llama3-Chinese-pro-8.4B-sft-1M 在对llama3-8b的base版本(meta-llama/Meta-Llama-3-8B)进行llama-pro拓展了两层后,进而通过一百万条SFT数据训练而得到。 Llama3-Chinese-pro-8.4B-sft-1M
Llama3-Chinese-pro-8.4B-sft-1M-ORPO 基于上一行产出的模型继续做ORPO进而得到

测试表现

展开查看 测试表现

  1. 随意的五个问题

先插入放两张没有训练完毕的Llama3-Chinese-pro-8.4B-sft-1M的回复,哈哈

Alt text

回到正经测评

Alt text

Alt text

主要贡献者 Contributors

排名不分先后

Contributor 1
linjh1118 @ Northeastern University
Llama3-Chinese-ORPO项目的核心贡献者
Contributor 2
Charon-ops @ Tsinghua University
Llama3-Chinese-ORPO项目的核心贡献者
Contributor 3
zzlf @ Northeastern University
Llama3-Chinese-ORPO项目的核心贡献者
Contributor 2
AIR-hl @ Northeastern University
Llama3-Chinese-ORPO项目的核心贡献者
Contributor 3
yanyi74 @ Northeastern University
Llama3-Chinese-ORPO项目的核心贡献者
Contributor 1
MrChen-NEU @ Northeastern University
Llama3-Chinese-ORPO项目的核心贡献者

非常非常感谢前人的优秀工作:https://github.com/CrazyBoyM/llama3-Chinese-chat (全球第一个中文llama3)

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论