



个人介绍
数字人图像算法工程师, 3年数字人算法经验(2D Gan + 3DGS),在线高清数字人全流程开发产品. 使用 Docker和 Api 进行 AI 部署.通过 蒸馏,剪枝,量化后压缩模型到tfLite格式。 英语流利,IELTS 7.0,外企工作经验
工作经历
2024-02-18 -至今北京爱是未来科技有限公司图像算法工程师
2D Gan数字人模型(wav2lip)的全流程研发到上线: 1.数据清洗处理,包括avoffset过滤,whisper分句,音画对齐,人脸检测,音频向量化,LSE-D/C过滤等。多进程使用GPU加速,全自动处理并生成training list. 2.高清模型训练调优。包括针对单人的保真模型(低L1 loss,高 LSE-C);可适用多人的通用模型(低L1 loss, 低LSE-D)。工作内容包括:数据增强,模型结构优化,训练策略优化,结果相关性分析等。 3.模型瘦身。包括对模型的蒸馏,剪枝,量化,转Onnx, tensorrt。模型大小最小能能到40MB。 4.工程化部署。使用Docker镜像结合fastapi实现api部署,优化推理结构,相关中间变量前置处理,提所有计算均转置GPU上执行,pytorch版本能达到至少200fps, tensorrt(Triton)版本能达到至少300fps. 5.手机端移植支持。将模型通过Onnx转到tfLite后,大小100MB左右,可支持android/ IOS端上部署。速度>25fps.用普通算子替换fLite在GPU端不支持的算子,使得能用
2021-03-18 -2024-01-21迈吉客科技有限公司算法Leader
1. AIGC 项目研发经验,包括 SD 文本生成图片视频,声音生成口型。 2. 部署 SD到 docker ,并通过 API与 Langchain/LLM 进行结合.
2019-01-01 -2021-02-01苹果北京研发有限公司机器学习工程师
1. 阅读英文论文,使用pytorch搭建神经网络,并在云服务器上进行训练,重现论文效果; 2. 设计结构化3D数据格式,并使用PyOpenGL搭建全新标定工具/ 数据批量生成工具; 3. 搭建FA工具,及使用Pandas自动汇报分析系统。
教育经历
2011-09-02 - 2014-03-01北京理工大学车辆工程硕士
智能车实验室,视觉环境感知方向