个人介绍
熟悉端侧 + 云端双端模型全流程部署与深度性能优化,擅长多模态大模型、目标检测、单目 / 双目深度估计等模型工程化落地;熟练掌握相机标定、3D 空间定位、视觉系统搭建,具备端云一体化落地能力。
工作经历
2025-07-04 -至今小米科技算法工程师
1. C700旗舰摄像头视频理解模型服务性能优化 负责C700旗舰摄像头Qwen3-VL多模态大模型云端部署推理优化,主要工作内容包括: (1)ViT编码器深度调优:通过模型重构、INT8量化、TensorRT推理、CUDA双流水线、位置编码缓存,大幅降低部署成本; (2)CUDA高性能算子开发:开发高性能注意力算子,解决FlashAttention分块计算、bit-packed掩码压缩问题,实现精度无损替换; (3)云端部署优化:基于 vLLM 推理框架完成 Qwen3-VL 多模态大模型的云端部署,实现推理流程优化与推理参数调优;并通过 Nsys 工具持续定位性能瓶颈,针对性完成问题排查与性能提升。 推理QPS从3.68提升至9.45,吞吐涨幅157%,大幅降低部署成本。核心看护场景精度无损,整体精度损失<1%,达成优化目标。 2. 全屋智能多设备联动标定 搭建多设备自动化联动标定方案,解决全屋智能项目获取全局定位信息难题,主要工作内容包括: (1)搭建联动标定全流程pipeline:针对扫地机与摄像头跨设备协同场景,设计自动化标定方案,完成多场景实测验证。 (2)融
教育经历
2022-09-01 - 2025-06-30武汉理工大学机械工程硕士
2018-09-01 - 2022-06-30武汉理工大学机械工程本科






