基于 TensorRT 加速 SadTalker 生成视频速度,在 RTX 4090 上实现最高 60 帧的生成速率,V100 上实现 25 帧的生成速率;
技术难点:
1. 实现三维 GridSample CUDA算子插件;
2. PyTorch 到 TensorRT 转换的相关问题;
3. TensorRT 推理相关问题。
点击空白处退出提示
基于 TensorRT 加速 SadTalker 生成视频速度,在 RTX 4090 上实现最高 60 帧的生成速率,V100 上实现 25 帧的生成速率;
技术难点:
1. 实现三维 GridSample CUDA算子插件;
2. PyTorch 到 TensorRT 转换的相关问题;
3. TensorRT 推理相关问题。
评论