千问2-7B-Keras_开源AI项目-程序员客栈

开源地址
https://modelscope.cn/models/q935499957/Qwen2-7B-Keras

使用方法请参考https://github.com/pass-li/bert4keras3
这是一个基于keras的版本的模型
支持tesorflow，jax，pytorch多后端调用
未来还能支持苹果的mlx
理论上umpy也能调用推理

from trasformers import AutoTokeizer
from bert4keras3.models import build_trasformer_model
import umpy as p 
import os
os.eviro["KERAS_BACKEND"] = "jax"#选择后端，jax是最优后端
os.eviro["FLASH_ATTN"]='0'#是否开启flash attetio，这个需要自己去安装
#jax使用flash参考https://github.com/shepperd/flash_att_jax/releases这里安装flash
os.eviro["ENABLE_LORA"] = "0"#1就是开启lora的
tokeizer = AutoTokeizer.from_pretraied(dict_path)#用hf加载tokeizer

Qwe = build_trasformer_model(
    cofig_path,#cofig文件
    keras_weights_path=weights_path,#weights.h5文件 
    model='qwe',
    with_lm=True,
    retur_keras_model=False,
)
model = Qwe.model#训练的模型
geerate_model=Qwe.build_cache_model([max_le],ed_toke=ed_toke,#ed toke是你对应模型的ed toke
            progress_prit=True,search_mode='topp',k=0.7)#推理模型
iputs = [start_toke]+tokeizer.ecode('hello world')#start toke同理
iputs = p.reshape(iputs,[1,-1])
geerate_model.predict(iputs)
model.predict(iputs)

使用方法请参考https://github.com/pass-lin/bert4keras3 这是一个基于keras的版本的模型支持tensorflow，jax，pytorch多后端调用未来还能支

声明：本文仅代表作者观点，不代表本站立场。如果侵犯到您的合法权益，请联系我们删除侵权资源！如果遇到资源链接失效，请您通过评论或工单的方式通知管理员。未经允许，不得转载，本站所有资源文章禁止商业使用运营!

下载安装【程序员客栈】APP

实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

前往安装

千问2-7B-Keras

技术信息

作品详情

功能介绍

重点城市程序员兼职推荐

重点岗位程序员兼职推荐