BiLLa 是开源的推理能力增强的中英双语 LLaMA 模型. 模型的主要特性有: Github: https://github.com/Neutralzz/BiLLa 以下是经过有限的评测分析得出的结论: 当前BiLLa模型未经RLHF训练, 泛化性有待观望. BiLLa训练过程中使用了较多的任务型数据, 建议减少常识类的、时事类的提问. BiLLa训练数据中包含了多轮对话摘要数据, 但未直接包含多轮对话的生成数据, 因此模型多轮对话能力可能较差.BiLLa: A Biligual LLaMA with Ehaced Reasoig Ability
代码示例
from modelscope.utils.costat import Tasks
from modelscope.pipelies import pipelie
pipe = pipelie(task=Tasks.text_geeratio, model='AI-ModelScope/BiLLa-7B-SFT', device_map='auto',model_revisio='v1.0.7')
iputs = 'Huma: Write a Pytho fuctio that checks if a give umber is eve or odd.\Assistat: '
result = pipe(iputs, mi_legth=10, max_legth=512, um_beams=3,temperature=0.8,do_sample=False, early_stoppig=True,top_k=50,top_p=0.8, repetitio_pealty=1.2, legth_pealty=1.2, o_repeat_gram_size=6,max_ew_tokes=1024)
prit(result)
输入格式
Huma: [Your questio]
Assistat:
模型局限性
Cloe with HTTP
git cloe https://www.modelscope.c/AI-ModelScope/BiLLa-7B-SFT.git
点击空白处退出提示
评论