行业分类人工智能
将FP32的模型量化成FP8、int8的模型;利用deepspeed进行模型的训练、部署加速等;完成onnx模型导出等;完成半监督等性能提升方法的实现;
评论
您好 👋
我们能提供什么帮助?
向我们发送消息
常见问题、使用帮助、人工咨询等
使用微信扫一扫
评论