该模型为原DeepSeek-R1-Distill-Qwen-1.5B蒸馏模型转换后的ONNX模型,该模型支持OP14及OP14以上ONNX框架进行部署,可用于适配到不同端侧硬件平台例如:Qualcomm,Atlas,CNStream等,该模型,最大生成长度被设置为32,768个令牌。对于需要采样的基准测试,使用0.6的温度值、0.95的top-p值,并且每条查询生成64个响应来估计pass@1,如需要模型源码文件及部署推理代码请联系我!
点击空白处退出提示
语言技术
Apache、Torch参考价格
1000
该模型为原DeepSeek-R1-Distill-Qwen-1.5B蒸馏模型转换后的ONNX模型,该模型支持OP14及OP14以上ONNX框架进行部署,可用于适配到不同端侧硬件平台例如:Qualcomm,Atlas,CNStream等,该模型,最大生成长度被设置为32,768个令牌。对于需要采样的基准测试,使用0.6的温度值、0.95的top-p值,并且每条查询生成64个响应来估计pass@1,如需要模型源码文件及部署推理代码请联系我!
评论